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CAPITULO 1 


1.6. Técnicas del conteo 


El objetivo de este capítulo es determinar el total de grupos que se pueden 
formar tomando parte o todos sus elementos de uno o más conjuntos y las 
restricciones que se imponen a los grupos. 


1.7. 


Con un solo conjunto 


1.1.1 


Si se tiene un conjunto con “п” elementos diferentes, todos los 
posibles grupos de tamaño “г” elementos que se pueden formar 


(para 7 <), sin tomar en cuenta el orden y sin reemplazo, es 
dado por: 


шт, п! 


(пр)! 


Si se tiene un conjunto соп “п” elementos diferentes, todos los 
posibles grupos de tamaño “г” elementos que se pueden formar 


(para 7 <), sin tomar en cuenta el orden y con reemplazo, es 
dado por: 


ma _ (n+r-1)! 
í (п = 1)! 


Si se tiene un conjunto соп “п” elementos diferentes, todos los 
posibles grupos de tamaño “г” elementos que se pueden formar 
(para " < п), tomando en cuenta el orden y sin reemplazo, es dado 
por: 


a MO 
"(nm 


А РЕ п 
Un caso particular, es cuando Y = И , luego V; = Р, =n! 
Si se tiene un conjunto con “п” elementos diferentes, todos los 
posibles grupos de tamaño “г” elementos que se pueden formar 
(para 7 < л) tomando en cuenta el orden y con reemplazo, es 
dado por: 


r 


n 


Si se tiene un conjunto con “n” elementos de los cuales n, son iguales, 


n, son iguales,..., n 


р 
son iguales, donde se cumple que Xn, =n, luego 
i=l 


P 


el total de permutaciones para los “n” elementos es: 
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п! 


(љ1)(0,1)...(п,!) 


1.8. Con dos о más conjuntos 


1.2.1 Principio de la multiplicación 


Un acontecimiento puede ocurrir de “a “formas diferentes, otro de “b” formas 
diferentes, y así sucesivamente, hasta que un acontecimiento puede ocurrir de 
“m” formas diferentes; entonces el total de formas (grupos) que puede ocurrir 
un acontecimiento completo (tomando un solo elemento de cada conjunto), es 


dado por el producto: 
(а)(5)..(т) 


1.2.2 Principio de la suma 


Un acontecimiento puede ocurrir de “a” maneras diferentes, otro de “b” 
maneras diferentes, y así sucesivamente, hasta que un acontecimiento puede 
ocurrir de “m” maneras diferentes. Suponiendo que los acontecimientos son 
mutuamente excluyentes(es decir, si ocurre uno de los acontecimientos ya no 
pueden ocurrir los otros); entonces cualquiera de los acontecimientos pueden 
ocurrir, está dada por la suma de las maneras; es decir, 


a+b+..+m 
Resumen: 


Se tienen un conjunto de “п” elementos diferentes y se eligen “г” elementos 
siendo (Ғғ <”), el total de grupos formados es dado por la siguiente forma: 


Característica del Я 
айра da tamaño (9 Sin reemplazo Con reemplazo 
n п! n+r-1 (п +r- 1)! 
Sin orden (>; ------- С. =e 
г!(п—т)1 (п = 1)! 
пг)! 4 
Con orden y” = (nr)! n 
r! 


1.9. Ejercicios resueltos 


Ejemplo 1. 

Una persona para llegar a su centro de trabajo, dispone de 8 líneas 
diferentes del metropolitano o de 4 líneas diferentes de microbús. ¿ De 
cuantas maneras diferentes se puede llegar a su centro de labor. 


Como los dos eventos son excluyentes(es decir si utilizo cualquier línea 
del metropolitano ya no podrá usar cualquier línea de microbús y 
viceversa) el total de maneras es dado por la suma de cada 
acontecimiento: 

8+4=12 
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Ejemplo 2. 


Sean los dígitos 11, 2, 3, 4 }, se eligen 3 dígitos al azar tomando еп 
cuenta el orden y sin reemplazo para formar un número, cuántos números 
de tres cifras se pueden formar. 


Como el número a formarse es de tres dígitos, el primer digito se puede 
elegir de 4 maneras diferentes; como es sin remplazo, el segundo digito 
se puede elegir de 3 maneras diferentes y por último el tercer digito se 
puede elegir de 2 maneras diferentes. Por lo tanto el total de números de 
tres dígitos que se pueden formar es dado por el producto de 
(4)(3)02) = 24 


Por fórmula 


ya AMOO 24 
(4-3)! 1 

Si la elección es con reemplazo, también por el principio de la 

multiplicación (4)(4)(4)=64 


Ejemplo 3. 


Sean los dígitos f, 2, 3,4, 5, 6, 7,8, 9}, se eligen 3 dígitos al azar tomando 
en cuenta el orden y con reemplazo para formar un número. Hallar el total 
de números que se pueden formar en los siguientes casos: 


Formar todos los posibles números. 
Como las extracciones son con reemplazo, el primer, segundo y tercer 


digito pueden ocurrir de 9 formas diferentes, entonces por el principio de 
la multiplicación se tiene: 


9 9 9 


El total de formas diferentes de formar números con tres dígitos es dado 
por la multiplicación de 9x9x9=729. 


Formar números pares 


Un número es par cuando la última cifra es par o cero, entonces el último 
digito puede ocurrir de 4 formas diferentes ( 2,4,6,8) y como es con 
reemplazo o restitución el primer y segundo digito pueden ocurrir de 9 
formas diferentes, entonces por el principio de la multiplicación se tiene: 

9 9 4 


El total de número pares que se pueden formar con tres dígitos es dado 
por la multiplicación de 9x9x4=324. 


Formar números mayores que 500 


El primer digito puede ocurrir de 5 formas diferentes para que sea mayor a 
500 (5,6,7,8,9), y como es con restitución el segundo y tercer digito 
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pueden ocurrir de 9 formas diferentes, entonces por el principio de la 
multiplicación se tiene: 


5 9 9 


El total de números que se pueden forman con tres dígitos mayores a 500 
es dado por la multiplicación de 5х9х9-405. 


Formar números de tal manera que el digito 3 se encuentre en el centro. 


El primer digito puede ocurrir de 9 formas diferentes, el segundo digito 
puede solo ocurrir de una 1 sola forma (corresponde al número 3) y tercer 
puede ocurrir de 9 formas, entonces por el principio de la multiplicación se 
tiene: 


9 1 9 


El total de números que se pueden formar, de tal manera que el número 
3 se encuentre en el centro es dado por la multiplicación de 9x1x9=81. 


Formar números de tal manera que sea mayor a 500 y par. 


El primer digito puede ocurrir de 5 formas diferentes (5, 6, 7, 8, 9), el 
segundo digito puede ocurrir de 9 formas diferentes y el tercer digito 
puede ocurrir de 4 formas diferentes, entonces por el principio de la 
multiplicación se tiene: 


5 9 4 


El total de números que se pueden formar, de tal manera que el número 
sea par y mayor a 500, es dado por la multiplicación de 5x9x4=180. 


Ejemplo 4. 


Sean los dígitos 0, 2,3,4, 5, 6, 7,8, y se eligen 3 dígitos al azar tomando 
en cuenta el orden y sin reemplazo para formar un número. Hallar el total 
de números que se pueden formar en los siguientes casos: 


Formar todos los posibles números. 


Como las extracciones son sin reemplazo, el primer, segundo y tercer 
dígitos pueden ocurrir respectivamente de 9, 8 y 7 formas diferentes, 
entonces por el principio de la multiplicación se tiene: 

9 8 7 


El total de números con tres dígitos es dado por la multiplicación de 
9x8x7=504. 


Formar números pares 


Un número es par cuando la última cifra es par o cero, entonces el último 
digito puede ocurrir de 4 formas diferentes (2, 4, 6, 8) y como es sin 
restitución el primer y segundo digito pueden ocurrir de 8 y 7 formas 
diferentes, entonces por el principio de la multiplicación se tiene: 
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8 7 4 


El total de número pares que se pueden formar con tres dígitos es dado 
por la multiplicación de 8x7x4=224. 


Formar números mayores que 500 


El primer digito puede ocurrir de 5 formas diferentes para que sea mayor 
a 500 (5,6,7,8,9), y como es sin restitución el segundo y tercer digito 
pueden ocurrir de 8 y 7 formas diferentes, entonces por el principio de la 
multiplicación se tiene: 


5 8 7 


El total de números que se pueden forman con tres dígitos mayores a 
500 es dado por la multiplicación de 5x8x7=280. 


Formar números de tal manera que el digito 3 se encuentre en el centro. 


El primer digito puede ocurrir de 8 formas diferentes, el segundo digito 
puede solo ocurrir de una 1 sola forma (corresponde al digito 3) y el 
tercer puede ocurrir de 7 formas por ser sin restitución, entonces por el 
principio de la multiplicación se tiene: 


8 1 7 


El total de números que se pueden formar, de tal manera que el número 
3 se encuentre en el centro es dado por la multiplicación de 8x1x7=56. 


Formar números de tal manera que sea mayor a 500 y par. 


Este problema se debe resolver por partes, tomando en cuenta el tercer 
digito par: 
Para el tercer digito par 2, puede ocurrir de una forma, el primer digito 
puede ocurrir de 5(5,6,7,8,9) formas diferentes, el segundo digito puede 
ocurrir de 7(1,3,4,6,7,8,9), se tiene: 

2 
5 7 1 
Para el tercer digito par 4, el primer digito puede ocurrir de 5(5,6,7,8,9) 
formas diferentes, el segundo digito puede ocurrir de 7(1,2,3,6,7,8,9), se 
tiene: 


5 7 1 
Para el tercer digito par 6, el primer digito puede ocurrir de 4(5,7,8,9) 
formas diferentes, el segundo digito puede ocurrir de 7(1,2,3,4,7,8,9), se 
tiene: 6 

4 7 1 
Para el tercer digito par 8, el primer digito puede ocurrir de 4(5,6,7,9) 
formas diferentes, el segundo digito puede ocurrir de 7(1,3,4,6,7,8,9), se 
tiene: 


4 7 1 
El total de números que se pueden formar, de tal manera que el número 
sea mayor a 500 y par, es dado por la suma de 35+35+28+28=126. 
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Ejemplo 5 

En una reunión asisten 4 varones y 6 mujeres, se eligen a 4 personas 
sin tomar en cuenta el orden y sin reemplazo(sin restitución), cuantos 
grupos se pueden formar en los siguientes casos: 


Todos los posibles grupos. 


wo 10 
` AD 


Todos los posibles grupos en la cual existan 3 varones y 1 mujer. 
CHO, =24 
Todos los posibles grupos en la cual existan 2 varones y 2 mujeres. 
С.С =90 
Todos los posibles grupos en la cual dos personas aparezcan juntas 


1.С; = 28 


Todos los posibles grupos en la cual dos personas по aparezcan juntas 
Са —1.Cf =210-28=182 
Ejercicio 6 


En una urna contiene 2 bolitas rojas, 1 verde y 1 negra, se eligen 4 
bolitas sin reemplazo. Determinar el total de grupo a formarse 


Al 


A O 

(21)011)(1!) 
RRVN VNRR RVNR VRRN RRNV NVRR 
RNVR NRRV RVRN RNRV VRNR NRVR 


1.10. Ejercicios propuestos 


1. 


Sean los dígitos (0,1, 2,3, 4, 5, 6,7, 8, 9}, se eligen 4 dígitos al azar y соп 
reemplazo para formar un número. Hallar: 

¿Cuántos números pares se pueden formar. 

¿Cuántos números son mayores a 5000. 

¿Cuántos números son menores que 7000. 

¿Cuántos números son mayores a 3000 pero menor a 8000. 
¿Cuántos números son mayores a 3500. 

¿Cuántos números contienen al digito 5. 


ES 
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En un estante existe 3 libros de historia, 4 de literatura y 2 de música, se 
eligen 2 libros sin reemplazo. Hallar todas las posibles combinaciones. 
En una reunión asisten 5 varones y 3 damas, se elige 2 personas al azar. 
Hallar todas las posibles combinaciones. 

Un bibliotecólogo para codificar revistas científicas dispone de los 
siguientes dígitos (0,1,2,3,4,5,6,7,8,9) 
dispone en cada caso: 

a. Se toma en cuenta el orden y con reemplazo 


b. ЗЅеїота en cuenta el orden y sin reemplazo 
с. Nose toma en cuenta el orden y sin reemplazo 


de cuantos códigos de 4 dígitos se 


Un cliente del Banco de la Nación tiene la posibilidad de escoger 4 de los 

siguientes 10 dígitos ( 0,1,2,3,4,5,6,7,8,9) como clave de su tarjeta 

Multired, Hallar todas las posibles combinaciones bajos las siguientes 

restricciones: 

Está permitido elegir un mismo digito( elección con reemplazo) 

No está permitido elegir un mismo digito( elección sin reemplazo) 

Que el número elegido sea par( con reemplazo y sin reemplazo) 

Que el número elegido sea impar( con reemplazo y sin reemplazo) 

Que el número elegido sea superior a 5000( con reemplazo y sin 

reemplazo) 

Que el número elegido sea inferior a 5000( con reemplazo y sin 

reemplazo) 

g Que el número elegido se encuentre entre 5000 y 8000( con 

reemplazo y sin reemplazo) 

h. Que el primer digito sea 4( con reemplazo y sin reemplazo) 

і Que el último digito sea 4( con reemplazo y sin reemplazo) 

| Que el segundo digito sea 0( con reemplazo y sin reemplazo) 

En una reunión de una prestigiosa empresa dedicada a la producción de 

llantas para automóviles asisten 12 varones y 8 mujeres, después de 

acaloradas discusiones se desea formar una comisión para analizar la 

estrategias de ventas: Dicha comisión debe estar integrada por 5 

personas. Hallar todas las posibilidades de elegir a las 5 personas bajo 

las siguientes condiciones. 

Elegir a cualquiera de ellos 

Que todos sean del sexo varón 

Que todos sean del sexo mujer 

Que haya 3 varones y 2 mujeres 

Que una mujer determinada presida el grupo 

Que un varón determinado presida el grupo 

Que una mujer este excluida del grupo 

Que un varón este excluido del grupo 

En una urna hay 4 bolas blancas, 5 rojas y 3 amarillas, se selecciona en 

forma aleatoria 5 bolas, cuantas formas existen de elegir las 5 bajo las 

siguientes modalidades: 

a. 2 sean blancas y З de otro color, sin reemplazo y sin considerar el 
orden de extracción. 

b. 3 sean blancas y 2 de otro color , con reemplazo y sin considerar el 
orden de extracción 

с. 2 sean amarillas y 3 de otro color, con reemplazo y considerando el 
orden de extracción. 


особу 


г“ 


тезотаосо 
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10. 


11. 


12. 


13. 


14. 


15. 


16. 


17. 


18. 


19. 


20. 


21. 


Una persona para llegar a cierta ciudad tiene que hacer uso de los 
siguientes medios de transportes; tiene 3 líneas de ómnibus para llegar a 
determinado paradero y 4 líneas de ómnibus para llegar al paradero final. 
¿De cuántas formas diferentes puede llegar al paradero final?. 

En una urna existen 4 bolas rojas y 3 bolas blancas, se elige al azar 3 
bolas con reemplazo. ¿Cuántas formas diferentes existen de elegir las 3 
bolas?. 

En un estante existen 5 libros de física de diferentes autores, 4 de 
matemáticas de diferentes autores y 3 libros de químicas de diferentes 
autores. ¿ cuántas formas existen de elegir tres libros de diferentes 
materias?. 

De la pregunta anterior, Hallar las formas de elegir tres libros al azar con 
reemplazo. 

De la pregunta 10, Hallar las formas de elegir tres libros al azar sin 
reemplazo. 

De la pregunta 10, Hallar las formas de elegir tres libros al azar sin con 
reemplazo, si un libro de física siempre debe aparecer en el centro. 

De la pregunta 10, Hallar las formas de elegir tres libros al azar con 
reemplazo, si un libro de física siempre debe aparecer en el centro. 

En una biblioteca concurren 50 alumnos, de los cuales 30 son varones, se 
eligen al azar 10 alumnos, de cuantas formas se pueden elegir 5 varones 
y 5 mujeres. 

Sean los dígitos (1, 2, 3, 4 !, se eligen 3 dígitos sin reemplazo, 
cuántos número de tres cifras menor o igual a 231 se pueden formar 

En una biblioteca concurren 50 alumnos, de los cuales 30 son varones, se 
eligen al azar 10 alumnos, de cuantas formas se pueden elegir 6 varones 


y 4 damas. 
Probar que: 
‚ Сі-Сіз1 
e С’ =п 
3 с” АЕ С" = С"! 
e C, =C 
„  n(n—-l)\(n-2)...(n-r+1) 
ө ES = 
1M0)6)..(r) 


Una base de datos contiene 20 libros de matemática, 10 de física y 8 de 

computación. Se eligen sin reemplazo 5 libros determinar: 

a. Todos los posibles grupos de 5 libros. 

b. Todos los posibles grupos que contenga 3 de matemática, 1 de 
física y 1 de computación. 

с. Todos los posibles grupos de la misma materia 

En un salón de clase existen 20 estudiantes, de los cuales 12 tienen más 

de 18 años. Se eligen a 5 personas. Cuantos grupos se pueden formar 

con 3 personas con más de 18 años. 

Una base de datos tienen 10 revistas científicas de matemática, 12 de 

física y 8 de química; se eligen a azar y sin reemplazo 4 revistas. Calcular 

las siguientes probabilidades: 

a. Que las 4 sean de química 

b. Que 2 sean de física y 2 de matemática 

с. Obtener por lo menos una de química 
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22. 


23. 


24. 


25. 


26. 


27. 


28. 


d. Que sean de diferente materias 
e. Que ninguna sean de química 


Una urna contiene 5 bolitas rojas y 2 bolitas verdes; se extraen 4 bolitas 
al azar y con reemplazo. Calcular las siguientes probabilidades: 

Obtener todas rojas 

Obtener todas verdes 

Obtener 1 rojas 

Obtener por lo menos 1 roja 

Obtener de diferente color 


особо 


Una moneda es lanzada 10 veces. Calcular las siguientes probabilidades: 
a. Obtener 3 caras 

b. Obtener por lo menos 1 cara 

с. Obtener 4 caras o obtener 7 caras 


Sean los dígitos fi, 2,3, 4, 5,6,7, 8,9}, se eligen al azar y sin reemplazo 3 
dígitos para formar un número: Cuantos números se pueden formar en 
los siguientes casos: 

a. Obtener pares 

b. Obtener mayores a 500 

с. Obtener menor a 300 

d. Obtener números pares y mayores a 700 


A una reunión asisten 20 varones y 30 mujeres. Se eligen al azar a 5 
personas. Calcular las siguientes probabilidades: 


Obtener del mismo sexo 
Obtener 4varones y 1 mujeres 
Obtener de diferentes sexos 
Obtener por lo menos 1 mujer 


apop 


Una base de datos está compuesta de 20 revistas científicas de 
estadística, 15 de matemáticas y 30 de computación, se eligen al azar y 
sin reemplazo 5 revistas. Calcular las siguientes probabilidades: 


Obtener 3 revistas de estadística 
Obtener de la misma materia 

Obtener de diferente materia 

Obtener por lo menos 1 de matemática 


apop 


Una urna contiene 4 bolitas rojas y 2 bolitas verdes, se eligen al azar y 
con reemplazo 4 bolitas: Calcular las siguientes probabilidades: 


Obtener 2 bolitas rojas 

Obtener del mismo color 

Obtener de diferentes colores 
Obtener por lo menos 1 bolita roja 


аосо 


Sean los dígitos (1,2,3,4,5,6,7,8,9), se eligen al azar y sin reemplazo tres 
dígitos para formar un número. Determinar: 
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29. 


30. 


31. 


32. 


33. 


El total de números. 

El total de números pares. 

El total de números impares. 

El total de números mayores a 300. 

El total de números menores a 700. 

El total de números entre 300 y 700. 

El total de números que contienen digito 5 al inicio. 
El total de números que contienen a número 5. 

El total de números que contienen al 1 y 2. 


“таесооаосо 


En una reunión asisten 12 varones y 8 mujeres, se eligen а 5 personas al 
azar, sin reemplazo y sin orden para formar grupos de trabajo. 
Determinar: 


El total de grupos formados. 

El total de grupos de solo varones. 

El total de grupos de solo mujeres. 

El total de grupos con tres varones y 2 mujeres. 

El total de grupos por lo menos un varón 

El total de grupos con una persona determinada. 

El total de grupos con dos perdonas determinada. 

El total de grupos en la cual una persona determinada no se 
encuentre incluida en el grupo. 


TO?Ppanogyp 


Una base de datos contiene 10 revistas científicas de matemática, 12 de 
física y 8 de química. Se eligen al azar 5 revistas, sin reemplazo y sin 
orden, para realizar una investigación. Determinar: 


El total de grupos de revistas elegidas. 

El total de grupos de revistas con dos de matemáticas 

El total de grupos de revistas con dos de química 

El total de grupos con dos de matemática, una de química y 2 de 
física. 


оос» 


Una moneda es lanzada 5 veces. Determinar: 


a. Todos los posibles resultados 

Todos los posibles grupos en la cual aparezcan 2 caras 

с. Todos los posibles grupos en la cual aparezcan por lo menos una 
сага. 


с 


Una base de datos contiene 12 revistas científicas de matemática, 14 де 
física y 20 de química, se eligen al azar y con reemplazo 5 revistas. 
Calcular la probabilidad de obtener por lo menos 1 de física. 
Probabilidades. 


Con los datos de la pregunta 1, se eligen al azar y sin reemplazo 5 
revistas. Calcular la probabilidad de obtener 2 de física. 
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34. 


35. 


36. 


Con los datos de la pregunta 1. ¿Cuál es la probabilidad de no obtener de 
física? 


Sean los dígitos (1, 2, 3, 4, 5, 6, 7, 8, 9), se eligen 3 dígitos al azar con 
reemplazo. ¿Cuál es la probabilidad de obtener 2 que sean mayores a 47. 


Una primera base de datos contiene 18 revistas científicas de matemática 
y 12 de física; una segunda base de datos contiene 22 de matemática y 
18 de física. Se eligen al azar una revista de la 1га base y una revista de 
la 2da base. Calcular probabilidad de obtener de diferentes materias. 
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2.1. 


CAPITULO 2 


Probabilidad 


Es una medida de la incertidumbre de un evento o suceso. En este capítulo, se 
presentan las bases para modelar situaciones donde interviene incertidumbre 
en la toma de decisión para un conjunto de datos observados. 


2.2. 


2.3. 


2.4. 


Experimento aleatorio (г) 


Es una operación o proceso físico o idealizado, cuyo resultado de la 
observación no se conoce con exactitud. El experimento deja de ser 
aleatorio cuando este concluye y se observa el resultado. 


En un experimento aleatorio, se conoce todos los posibles resultados, 
pero no se conoce el resultado del experimento en particular. 


Ejemplos. 


Є =Elegir una bolita de una urna que contiene 1 bolitas rojas y 1 blancas 
y Observar su resultado. 


Є. =Lanzar una moneda dos veces y observar su resultado. 


€ 3 =Registra el tiempo (horas) de vida de un foco eléctrico elegido al azar 
y Observar su resultado. 


€ 4 = Lanzar una moneda hasta que aparezca la primera сага, y observar 
su resultado. 


Є; = Elegir al azar a un recién nacido y registra el peso (Kg.) y observar 
su peso. 


66 = Elegir al azar y sin reemplazo a З revistas científicas, de un total de 
12 de matemática, 8 de física y 10 de química, y observar su resultado. 


Características de un experimento aleatorio. 


a. Puede ser repetido infinita veces, bajo las mismas condiciones. 

р. Los resultados posibles de un experimento, se pueden conocer а 
priori; es decir se puede enumerar todos los posibles resultados del 
experimento aleatorio. 

с. Рага ип experimento aleatorio es casi siempre posible establecer un 
modelo probabilístico. 


Espacio muestral (О) 


Es el conjunto de todos los posibles resultados de un experimento 
aleatorio, es denotado por ((2) y al total de resultados se representa por 


n(Q). А cada resultado posible se le llama elemento o punto muestral 
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Ejemplos: 


6) = Elegir con reemplazo 2 bolitas de una urna que contiene 1 bolitas 
rojas y 1 bolitas blancas y anotar sus resultados. 


O, = {RR, RB, BR, BB) nQ,)=4 
6; = Lanzar una moneda dos veces y anotar sus resultados 
О, = (сс), (cs), (sc), (ss), "(О,)-4 
Є; = registra el tiempo (horas) de vida de un foco eléctrico. 
O, =(t/t, 1>0) 


€ 4 = lanzar una moneda hasta que aparezca la primera cara. 


O, = {с, SC, SSC, SSSC, 5558С,...} 
€; = Elegir a un recién nacido y registrar su peso (Kg.) 


О, = {х/х= peso, 0<х<10) 


66 = Elegir sin reemplazo a 2 personas de un total de 3 varones 
(V,,V,,V,) y 2 mujeres (M,,M,), y observar su resultado. 


О, - IV, V V, V,V,,V,M,V,M,V,M,,V,M,,V,M,,V,M,,M,M, Ь 
"О)-10 


&6 = Elegir al azar y sin reemplazo a 3 revistas científicas, de un total de 
12 de matemática, 8 de física y 10 de química, y observar su resultado. 


n(Q,)=4060 posibles resultados 


2.5. Tipos de espacio muestral: 


Espacio muestral discreto 


Si el espacio muestral tiene un número finito o infinito numerable de 
elementos. 

Ejemplo: del ejemplo anterior 

Son los espacios muestrales (2,602,602, 

Espacio muestral continuo 


Si el espacio muestral tiene un número infinito no numerable de 
elementos. 
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2.6. 


2.7. 


Ejemplos: 
Son los espacios muestrales О,,О,,О; 


Eventos o sucesos 


Es un subconjunto del espacio muestral, o es el conjunto de todos los 
posibles resultados que le interesa en forma particular al investigador. A 
los eventos se le representa por lo general con las primeras letras 
mayúsculas del abecedario o también con letra mayúscula acompañada 
con subíndice. 


Ejemplo: 


De los 5 espacios muestrales anteriores se definen los siguientes 
eventos: 


A =Obtener bolitas de diferentes colores. 

B =Obtener una cara en los dos lanzamiento. 

C= Que el tiempo de vida se encuentre entre 980 horas y 1200 horas 
D =Que ocurra cara en el 5to. Lanzamiento. 

E =Que el peso del recién nacido se encuentre entre 2.5 y 3.4 Kg. 

F =Obtener solo varones. 


Eventos mutuamente excluyentes 


Sean A y B dos eventos definidos en el espacio muestral Q , se dice que 
los eventos son mutuamente excluyentes, si y solo si, estos no pueden 
ocurrir simultáneamente, es decir si el evento “A” ocurre, ya no ocurre 
el evento В (viceversa); se representa matemáticamente рог: 
ANB=0 


Ejemplo 
Lanzar un dado dos veces, sean los eventos 


A = Que la suma de sus puntos sean 7 
B = Que la suma de su puntos sean 11 


Luego los eventos A y B son mutuamente excluyentes; es decir si ocurre 
el evento A ya no ocurre el evento B, y viceversa. 


2.8. Tipos de eventos 


Eventos simples 


Son aquellos eventos que tienen un solo elemento del espacio muestral 
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Ejemplo 


€ = Lanzar un dado dos veces. 


Ы 
12 
13 
14 
1,5 
1,6 


2,1 

2,2 
253 
2,4 
2,5 
2,6 


31 41 51 61 

32 42 52 62 
33 43 53 62 
3,4 44 54 64 
35 45 55 6,5 
3,6 46 56 6,6 


Sea el evento simple: 


A = Que la suma de los resultados sea 2= ((1,1)) 


Eventos compuestos 


Son aquellos, eventos que tienen más de un elemento del espacio 


muestral 


Ejemplo 


Del ejemplo anterior del lanzamiento de dos dados 


A = Que la suma sea 7= ((3,4), (4,3), (2,5), (5,21(6,1), (1,6)) 


Eventos nulo o vacío 


Son aquellos eventos que no tiene elementos del espacio muestral 
Del ejemplo anterior del lanzamiento de dos dados 


А = Que la suma sea 13=[ |-ф 


Eventos igualmente probables: 


Dos o más eventos simples son igualmente probables, si tienen la misma 


probabilidad de ocurrir. 


Ejemplo-1 


Se lanza un dado dos veces, los 36 eventos simples de la forma (x, y)son 
igualmente probables; es decir cada evento simple tiene la misma 
oportunidad de ocurrir. 


Ejemplo-2 


Una urna contiene 8 bolas rojas y 2 bolas blancas, se elige una bola al 
azar, los eventos simples serán cada uno de los resultados posibles en 
este caso roja о blanca, notamos que la probabilidad de sacar bola roja 
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2.9. 


es más probable que sacar bola blanca, entonces los eventos simples no 
son igualmente probables. 


Definición clásica de probabilidad 


Es la manera más antigua de calcular probabilidades de eventos 
igualmente probables. Sea в, un experimento aleatorio, О su espacio 
muestral, con л(О) resultados igualmente probables. Sea А un evento 
definido en О, con n(4)resultados igualmente probables. La probabilidad 
de que ocurra el evento A, denotado por P(A), es un número positivo 
definido por: 


P(A)= n(A) _ N°de elementos del evento A 
n(Q) N°de elementos del espacio muestral 8 
Ejemplo 1 


Del ejemplo de lanzar un dado dos veces, cual es la probabilidad de que 
la suma de sus resultados sea siete. 


Sea el evento A = La suma de los resultados de lanzar un dado dos 
veces sea siete. 


A= (6,4), (4,3), (2,5), (5,2)(6,1),(1,6)} Entonces n(4)=6 


Como n(Q) = 36, corresponde a todos los resultados posibles de lanzar 
un dado dos veces. 


_n(A) _ N°de elementos del evento A _ 6 
"О) N”de elementos del espacio muestral О 36 


P(4) 


Interpretación: 


La Probabilidad de obtener la suma de los resultados 7, cuando se lanza 
un dado dos veces es 0.1667 o el 16.67%. 


Ejemplo 2 


A una reunión asisten 30 varones y 40 mujeres, se eligen a 10 personas 
al azar sin reemplazo. Hallar las siguientes probabilidades: 


a) Elegir 6 varones y 4 mujeres 
b) Elegir por lo menos 4 varones 


Solución para (a) 


Q =Todas las posibles formas de elegir 10 personas de un total de 70, 
sin reemplazo: 


п(О) = С 
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Sea el evento A de interés, todas las formas posibles de elegir 6 
varones y 4 mujeres de un total de 70 personas, es dado por: 


п(А)= С.С 
n(A) _ С.С? 


Luego Р(А)= O) cr 
10 


= 0.1368 


Solución para (b) 


Sea el evento B elegir por lo menos 4 varones, significa que en el grupo 
de 10 personas elegidas, deben haber 4 varones y 6 mujeres; 5 
varones y 5 mujeres; 6 varones y 4 mujeres; 7 varones y 3 mujeres; 8 
varones y 2 mujeres; 9 varones y 1 mujeres o 10 varones. 


п(В) = СС +С;?°С;° СОС + СЗС +С?°С° OC + Cia 


Бүл ессе +...+ CR 


Е = 0.702052255 
п(О) Со 


P(B) 


Ejemplo 3 


Una base de datos contiene 12 revistas científicas de matemáticas, 18 
de física y 10 de química. Se eligen al azar y sin reemplazo 2 revistas. 
Calcular las siguientes probabilidades: 


a) Obtener de la misma materia 
b) Obtener de diferente materia 


Solución para a) 


Q =Todas las posibles formas de elegir 3 revistas científicas sin 
reemplazo de un total de 12 revistas científicas de matemáticas, 18 de 
física y 20 de química. 


п(О) = С;° =1225 
Sea el evento A obtener de la misma materia, de un total de 12 revistas 
científicas de matemáticas, 18 de física y 20 de química es dado por: 


п(А) = C7 +C +C? = 409 


n(A) 409 
п(О) 1225 
Solución рага b) 


Sea el evento A obtener de diferente materia, de un total de 12 revistas 
científicas de matemáticas, 18 de física y 20 de química es dado por: 


n(A) = С.С + С.С? CC? = 816 


Luego P(A)= = 0.3339 
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жа) _ 816 


Luego Р(4)- nO) E 


= 0.6661 


2.10. Definición frecuencia relativa de probabilidad 


Si un experimento aleatorio se repite M veces bajo las mismas 
condiciones, si 7; de esas veces que se repite el experimento ocurre el 


evento de interés А. Luego la frecuencia relativa del evento 4 es: 
Ma 

h,== 

п 


Si se repite el experimento muchas veces, en el límite la probabilidad de 
ocurrencia del evento A es: 
Lim h, =Lim"4 = P(A) 
n 


n>% 
n>0 


La probabilidad P(4), es el valor en el cual se estabiliza la frecuencia 


relativa del evento de interés, después de haber repetido un número 
grande de veces. 


Ejemplo 
Suponiendo que en una garita de peaje transitan casi siempre durante el 


día 8,000 vehículos, de los cuales 4,000 son autos, 2,500 son camiones y 
1,500 corresponde a ómnibus. 


Tipos de vehículos Frecuencias Frecuencia relativa 
Autos 4000 0.5000 
Camiones 2500 0.3125 
Ómnibus 1500 0.1875 
Total 8000 1. 000 


¿Cuál es la probabilidad de que pase por la garita de peaje un camión?. 


Sea el evento A = que pase un camión por la garita de peaje, 
luego: 


Р(А) = zo =0.3125 


¿Cuál es la probabilidad de que pase por la garita de peaje un camión o 
ómnibus?. 


Sea el evento B = que pase un camión o ómnibus por la garita de 
peaje, 


2500 +1500 _ 


P(A)= 
(4) 8000 


0.5 
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2.11. Definición axiomática de probabilidad 


Sea e, ип experimento aleatorio у Q su espacio muestral asociado al 
experimento, sea 4 un evento de interés definido en el espacio muestral, 


la probabilidad de que ocurra el evento 4, es un número real positivo 
denotado por P(4), que cumple los siguientes axiomas: 


a. 0<Р(4)<1 

b.  P(Q)=1 

с. Sean А, y А, eventos mutuamente excluyente definidos еп 
Q, entonces se cumple que: 


P(4,04,) = Р(А U А,) = Р(А,) +Р(А,) 


El axioma (c) se generaliza para más de dos eventos mutuamente 
excluyentes, siempre y cuando que sean excluyentes dos a dos. 


Los tres axiomas son las bases para los siguientes teoremas: 


1. бі ф, es el conjunto vacío, entonces Іа Р(ф)=0 


Demostración 


Sea A un evento definido en el espacio muestral О, entonces se cumple 
que: 4AUG$=A4, pero А y 9, son eventos mutuamente excluyentes; es 


decir Ас\ф = ф, haciendo uso del axioma (с), se tiene que: 
Р(Ачф) = P(A) + Р(ф) = P(A) > P($) =0 
2. Sea 4° un evento complemento del evento 4, entonces se cumple que: 
Р(А°) =1-P(4) 
Demostración 


н в В € 
Sea A ип evento definido en el espacio muestral (2, 4° su evento 
complemento, además ambos son eventos mutuamente excluyentes; es 


decir А0 А = ф, también se cumple дие: AU 4“ = О, haciendo uso 
del axioma (с), se tiene que: 


P(Q) = PAD AS) >1=P(4) + P(4°) > P(4) =1-P(4) 


3. Sean A y В dos eventos definidos en el espacio muestral О, 
supongamos que 4c В, entonces se cumple que: 


P(4)<P(B) 
Demostración( queda para el alumno) 
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4. Sean A y B dos eventos cualesquiera definidos en el espacio muestral 
О, entonces se cumple que, la probabilidad de que ocurra el evento A o 
el evento B o ambos a la vez A y B es dado por: 

P(AU В) = Р(А) + P(B)-P(AN В) 
Demostración( queda para el alumno) 


Ejemplo-1 


Sean los dígitos: 1 ‚2,3, 4, 5, 6,7, 8, 9}; se elige un dígito al azar. Calcular las 
siguientes probabilidades: 


a. Que el número elegido sea menor a 4 o superior a 7. 
b. Que el número elegido sea par o superior а 6. 
с. Que el número elegido no sea 4 


Solución para (a) 


Sean los eventos A=que el numero elegido sea menor a 4; B= que el numero 
elegido sea superior a 7, luego: 


А= {1,2,3} 
В = {8 ,9,) 
Como los eventos A y B son mutuamente excluyentes, luego: 


PAVO В) = PA) Р(В) 2+2=2 


9 
Solución рага (b) 


Sean los eventos Á =que el número elegido sea раг; В =que el número 
elegido sea superior a 6, luego: 


А= 0, 4,6,8,) 
В = {7, 8,9) 
Como los eventos А у В no son mutuamente excluyentes, luego: 


P(AU В) = Р(А)+ P(B)-P(AN В) 
La intercepción de Á y В es 


Аг\В = {8} 


4 3 1 6 
P(AU B)=P(4)+P(B)-P(4AB)=—+ === 
( ) (4) + P(B)-P( ) 9197979 
Solución para (с) 


, А с 
Sean los eventos Á =que el número elegido sea 4 y su complemento A= 
que el número elegido no sea 4: 


A=(4) 
1 9-1 8 


O = = 
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Ejemplo-2 


Una base de datos contiene 10 libros de matemática y 40 de física, se extraen 
5 libros al azar y sin reemplazo. ¿ cuál es la probabilidad de obtener por lo 
menos un libro de matemática?. 


А =по obtener un libro de matemática en las 5 extracciones = {0М5Е} 


А“ =obtener рог lo menos un libro de matemática en las 5 extracciones= 
=(1M4F,2M3F,3M2F,4M1F,5MO0F| 
Cs 


50 
С; 


P(4%)=1-P(4)=1 


0.689437 


2.12. Probabilidad condicional 


Sea A у В dos eventos definidos en el espacio muestral О. Supongamos que 
el evento B ya ocurrió. ¿Cuál es la probabilidad de que ocurra el evento A?. El 
valor de la probabilidad pedida se representa por P(4/B), y se calcula por: 


(4AB) 


P(A/ В) = 2 Р(В) раға P(B)>0 


Demostración 
Suponiendo que el evento В ocurrió, luego el espacio muestral О se reduce а 


B, aquí se supone que el evento A tiene algunos elementos de B, luego la 
probabilidad de que A ocurra dado que el evento B ocurrió se calcula por: 


P(A/B)= тя раға n(B)>0 dividiendo рог n(Q) 
о сас Иа а para P(B)>0 
n(B)/n(Q) P(B) 


La Р(А/В), cumple con los 3 axioma de probabilidad. 
Ejemplo: 


Un centro de información tiene 11,590 revistas científicas, las cuales están 
clasificadas según la materia y su idioma. 


Materias 

Matemáticas Física Química Total 
Idiomas 
Inglés 1200 900 850 2950 
Portugués 700 1500 900 3100 
Español 1000 980 1200 3180 
Francés 800 970 590 2360 
Total 3700 4350 3540 11590 
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Se elige una revista al azar y supongamos que la revista está escrita en inglés, 
¿Cuál es la probabilidad de que sea de física?: 

Sean los eventos: 

A= revistas de física 

B= revistas escritas en inglés 


ва/ру- 409) 
Р(В) 
De la tabla: 
La probabilidad de que sea de física y escrito en inglés: 


P(ANB) = 002 
11590 


La probabilidad de que este escrito en inglés: 


P(B) = 222° 
11590 
Luego: 
Pa = EOB) 1900 030508 
P(B) 2950 


Otra forma de obtener este resultado: 

Como el evento B ya ocurrió, el espacio muestral original conformado por la 
11,590 formas de elegir una revista con esas dos características se reduce a 
solo 2,950 revista escritas en inglés, de las cuales 900 son de física, entonces: 


Р(А/ В) = 2. - 0.30508 
2950 


2.13. Regla de la multiplicación de probabilidades 
De la probabilidad condicional 


Р(Ас\В) 


P(A/B)= Ра 


ә Р(А В) = Р(В)Р(А/ В) (1) 
También se tiene дие la probabilidad de que ocurra el evento В suponiendo 
que ya ocurrió el evento A, es dado por: 


Р(В с\А) 
P(4) 


P(B/A)= 5 Р(Вс\А)= Р(А)Р(В/ А) (2) 


De 1 у 2 se tiene que: 
Р(Ас\В)= Р(В)Р(А/ В) = Р(А)Р(В/ А) 
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Ejemplo 


Del ejemplo anterior, se eligen al azar y sin reemplazo dos revistas, calcular las 
siguientes probabilidades: 


1. Que la primera revista sea de física y la segunda de física ( equivale decir 
también a que ambas sean de física) 


Sean los eventos: 


A=Elegir una revista de física 
B=Elegir una revista de física 


рР(Ас\В) = Р(А)Р(В/ Ау = 2220 +88 — 0.140847539 
11590 11589 


También: 


4350 
P(Ambas revistas sean de fisica) = Си = 0.140847539 
2 


2. Quela primera revista sea de física у la segunda de matemática 
Sean los eventos: 


A=Elegir una revista de física 
B=Elegir una revista de matemática 


РА В) = Р(А)Р(ВЈ А) = 2320 » 3700 — 011983 
11590 11589 


3. Del ejemplo anterior supongamos que se eligen tres revistas al azar y sin 
reemplazo, cual es la probabilidad de que la primera revista este en 
idioma inglés, la segunda en idioma inglés y la tercera en idioma español. 
Sean los eventos: 

A=Elegir la primera revista en idioma ingles 
B=Elegir la segunda revista en idioma ingles 
C=Elegir la tercera revista en idioma español 


2950 , 2949 , 3180 


Р(Ас\Вс\С) = Р(А)Р(В/ А)Р(С/Ас\В)= 
( ) cor “ ) 11590 11589 11588 


=0.01777 


2.14. Regla de la multiplicación para más de dos eventos cualesquiera 


Sean 4,,4,..... А, eventos definidos en el espacio muestral О, entonces la 
probabilidad de que ocurran todos estos eventos en ese orden es dato por: 


P(A, с\ А,с\,...,с\А„) = Р(А)Р(А, / А,)Р(А, / А, 04)),..., PLA, / A, O А,,...С\ А„\) 
Con la condición de que P(4, NA4,,...MA,,,)>0 
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2.15. Partición del espacio muestral 


Sean 4,,4,..... 4, eventos mutuamente excluyentes definidos еп el espacio 


muestral Q, entonces 4,,4,.,..., 4, , constituye una partición, si cumplen las 
siguientes condiciones: 

a 4-ф V; 

5. А.с; = ф Мм) 

с. 44U4A,U..UA,)=0 


А А, А, = A 


2.16. Teorema de la probabilidad total 


Sean 4, 4,,...,4, una partición del espacio muestral, definimos en estas 
particiones otro evento tal como B, luego se cumple que: 


P(B) = Y PLA, ^B) 


Demostración: 
Del gráfico: 


B=(A,NB)V(4,NB)U..L(BNA,), por ser estas intercepciones 
(4, NB) mutuamente excluyentes рага y, luego se cumple que: 


Р(В) = Р(А, В) +Р(А, OB)J+..P(BOA,)= Y P(4, NB) 
i=l 
2.17. Teorema de bayes 


Sean 24, 4,,...,4 


partición otro evento В, entonces la probabilidad де que ocurra un evento 4, 
suponiendo que ocurrió el evento B, es dado por: 


una partición del espacio muestral, definimos en esta 


n 


Р(А с\В) Р(А)Р(В/А) Р(АУР(В/4) 
PCB) PE) Y PA)PB/A) 


Р(А,/ В) = і=1,2,3,..п 
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Ejemplo 


Un fabricante de chompas produce en un día determinado 1000 chompas; 300 
son para varones, 250 para mujer y 450 para niños: La probabilidad de que una 
chompa de varón tenga falla en el tejido es de 0.01, para mujer es de 0.025 y 
para niños es de 0.05, de la producción de ese día se elige una chompa al 
azar; Hallar las siguientes probabilidades: 


1. Que la chompa tenga falla 

2. Que la chompa no tenga falla 

3. Supongamos que se elige una chompa y tiene falla. ¿Cuál es la 
probabilidad de que sea de varón? 


De la información se tiene: 


Sean los eventos: 
A, =chompa de varón 
A, =chompa de mujer 
A, =chompa de niño 
B = chompa con falla 


Del enunciado se tiene las siguientes probabilidades: 


P(4) -2% -0.3 
1000 
Жал 2 -0.25 
221000 
450 
Р(А,) == = 0.45 
(4) 1000 
Р(В/ А,) = 0.01 


P(B/ А,) = 0.025 
P(B/ А,) = 0.05 


La probabilidad pedida es: 


P(B) = Р(А,)Р(В/ А) + P(4,)P(B/ 4,) + Р(А,)Р(ВГА,) 
P(B) =0.3*0.01+0.25*0.025 +0.45 * 0.05 = 0.032 


Interpretación: 


Existe una probabilidad del 0.032 o 3.2% de elegir una chompa de la fábrica y 
que tenga falla. 


La probabilidad pedida es: 
P(B*) = 1- P(B)=1-0.032=0.968 o 96.8% 
La probabilidad pedida es: 
* 
P(4,/B)= Р(А AB) Р(А)Р(В/А4) _ 0.3*0.01 
P(B) P(B) 0.032 


= 0.094 
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Lo 1х2. INS INICIA webe VINO 


Sean А y B dos eventos definidos en el espacio muestral (2, se dice que el 


evento Á es independiente del evento В, si la probabilidad de ocurrencia del 
evento A, no se ve afectado por la ocurrencia o no del evento B y viceversa; es 
decir, 

P(AIB)=P(4) o Р(В/ А) = P(B) 


Рог lo tanto, si los eventos А у В son independientes, entonces: 
Р(де que ocurra los eventos A у В en forma simul tan ea) = P(A y В) = Р(А В) 


= P(4).P(B) 
Teoremas 


Sean 4 y В dos eventos independientes definidos еп Q , 4“ y В“ 
sus eventos complementos respectivamente, luego se cumplen los siguientes 


teoremas: 


1. PA ^ B) = Р(А°)Р(В) 
2. PAN B")=P(A)P(B") 


3. Р(А В") = Р(А)Р(В") 

Demostración de (3) 

АВ“ = (40 В)“ Por la Ley de Morgan 

Р(А с\В°)=Р(Ах» В) =1-P(4U B)=1-P(4)-P(B)+P(AN В) 
Р(А“сВӘ)-1-Р(А)-Р(В)-Р(А)Р(В) 


Р(А° с\В°)= (1— Р(А))— Р(В)(1— Р(А)) 


Р(А° OB) = (1—- Р(А))(1-— Р(В)) = Р(А°)Р(В°) 


2.19. Ejercicios resueltos 


Se tiene dos urnas la primera contiene dos bolas rojas y una bola blanca, la 
segunda urna contiene una bola roja y dos bolas blancas, se elige una bola de 
cada urna. Calcular las siguientes probabilidades: 


Que la primera bola sea roja y la segunda blanca 
Que la primera sea roja y la segunda sea roja 
Que ambas bolas sean del mismo color. 

Que ambas sean de diferente color 


оос 
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Sean los eventos: 


К = Obtener una bola roja 
В = Obtener una bola blanca 


Para (a) 


P(R, NB,)=P(R,)P(B,), ambos eventos son independientes, luego: 
22 4 
РСВ еВ.) = Р(К)Р(В,) = = 0 


Рага (b) 


P(R, NR,)=P(R,)P(R,), ambos eventos son independientes, luego: 
21 2 
P(R|OR,)=P(RIP(R,)==.2== 
( 2)= P(R)P(R,) = 437, 
Рага (с) 


Р(К QR, о В,с\В,)= Р(К,с\ К,) + P(B, MB,), ambos eventos son 
excluyentes y luego independientes, luego: 


P(R, OR, оВ, A В,) = P(R,).P(R,)+ Р(В,).Р(В,) 


21124 
33 3 3 9 


P(R OR, o В, OB,)= 
Para (d) 


P(R OB, о ВК) = Р(К, т В,) + Р( В, AR,), ambos eventos son 
excluyentes у luego independientes, luego: 


P(R, ^B, о B,OR,)=PR).P(B,)+P(B).P(R,) 


1 


P(R, ^B, 0 B AR,)= a => 


ыы 
ss 
ша 


También por complemento 


P(+ color) =1— Р(= color) 1-5 


л 


2.20. Ејегсісіоѕ ргориеѕіоѕ 


1. Una caja contiene 8 bolsas de detergentes marca А y 5 bolsas de 
detergente marca В, se extraen al azar y con reemplazo 4 bolsas. ¿ Cuál 
es la probabilidad de que sean extraídas 3 bolsas del detergente A y 1 
bolsa del detergente B? 
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En una reunión asisten 12 varones y 8 damas, se selecciona al azar 5 
personas. ¿Cuál es la probabilidad de que 3 sean damas. 

En una ciudad hay 3 vendedores de gas(A; В y С). Un día 5 residentes 
llaman a un vendedor de gas. Si cada residente selecciona al azar al 
vendedor de gas. 


a. ¿Cuáles la probabilidad de que todos los vendedores de gas sean 


elegidos. 

b. ¿Cuál es la probabilidad de que solo 2 vendedores de gas sean 
elegidos. 

с. ¿Cuál es la probabilidad de que solo vendedores de gas A y В sean 
elegidos. 


Se tienen los dígitos { 1,2,3,4,5,6,7,8,9) , se eligen З dígitos al azar y con 
reemplazo. Hallar las siguientes probabilidades: 


Que el número elegido sea par 

Que el número elegido sea impar 

Que el número elegido sean mayor a 400 

Que el número elegido se encuentre entre 300 y 600 
Que el número elegido contenga al número 5 en el centro 
Que el número elegido contenga al número 5 al inicio 

g. Que el número elegido contenga al número 5 al final 


зтаосош 


Del ejemplo anterior Hallar las probabilidades para el caso de elegir los 3 
dígitos al azar y sin reemplazo. 

Si los dígitos (2,2,2,5,5,7,8), se distribuyen al azar para formar un número 
de 7 cifras. ¿ Cuál es la probabilidad de que el numero formado se 
encuentren los dígitos 5 juntos?. 

Una caja contiene 4 focos malos y 6 buenos, se sacan dos a la vez, si se 
prueba uno de ellos y se encuentra que es malo: ¿Cuál es la probabilidad 
de que el otro también sea malo? 

En un hotel se hospedan 6 arequipeños y 4 huanuqueño. Se elige en 
forma aleatoria a 3 personas del hotel. ¿Cuál es la probabilidad de que al 
menos uno de ellos sea arequipeño? 

El gerente de una tienda comercial de dedicada a la venta para varones, 
toma una muestra aleatoria de 200 clientes y lo organiza de acuerdo a la 
siguiente tabla de doble entrada, tal como se muestra: 


CLIENTES COMPRAN A COMPRAN AL TOTAL 
CRÉDITO CONTADO 
CON TARJETA 80 40 120 
DE CRÉDITOS 
SIN TARJETA DE 50 60 110 
CRÉDITOS 
TOTAL 130 100 230 
a. ¿Cuál es probabilidad de que no tenga tarjeta de crédito o compre 
a crédito? 
b. ¿Cuál es la probabilidad de que tenga tarjeta de crédito y compre a 
crédito? 
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10. 


11. 


12. 


13. 


14. 


с. Зі se sabe que tiene tarjeta de crédito. ¿Cuál es la probabilidad de 
que compre a crédito? 

а. Se seleccionan а 3 clientes a azar, sin reemplazo. ¿Cuál es la 
probabilidad de que al menos uno compre al contado? 

e. Se seleccionan а 3 clientes al azar con reemplazo.¿ Cuál es la 
probabilidad de que 2 tengan tarjetas de crédito? 


Una compañía de cerveza tiene dos lavadoras de botellas. La lavadora 

“A” procesa un 20% de todas las botellas utilizadas diariamente y rompe 

un 3% de las que lava. La lavadora “B” procesa las restantes y rompe un 

4%. 

a. ¿Cuáles Іа probabilidad de que una botella lavada, seleccionada al 
azar este rota? 

b. Опа botella lavada seleccionada al azar, está rota. ¿Cuál а 
probabilidad de que haya sido lavada en la lavadora “А”?. 

с. Una botella lavada seleccionada al azar, no está rota. ¿Cuál es la 
probabilidad de que haya sido lavada por la lavadora “A”? 


Una base de datos contiene 50 libros de física y 20 de química y 30 de 
matemáticas, se eligen al azar y sin reemplazo 5 libros. Hallar las 
siguientes probabilidades. 


Que 3 sean de Matemática y 2 de Química. 

Que 2 sean de Química, 2 de Matemática y 1 de Física. 

Que los 5 sean de Matemática. 

Que 3 sean de Matemática y 2 de Física o los 5 sean de 
Matemática 

e. Que los 5 libros sean de Física o 5 sean de Química. 

f Que los 5 sean de Matemática o 5 de Química o 5 de Física. 


oo up 


Sean los dígitos: 1, 2, 3, 4, 5, 6, 7, 8, 9, se eligen tres dígitos al azar con 
reemplazo para formar un número. Cuál es la probabilidad de que el 
número formado sea par o mayor a 500. 


Una primera base de datos contiene 10 revistas de computación y 10 de 
física, otra segunda base contiene 8 de computación y 12 de física. Se 
elige una revista de cada base de datos. Calcular las siguientes 
probabilidades. 


a. Оче sean de la misma materia 
р. Que sean de diferentes materias 


Una base de datos está compuesta por 50 libros de física, 20 de 
matemática y 30 de química, se eligen al azar y sin reemplazo 5 libros. 
Calcular las siguientes probabilidades: 

Obtener 2 de física, 2 química y 1 de matemática 

Obtener 2 de física 

Obtener solo de física 

Obtener de la misma materia 

Obtener de diferentes materias 

Obtener por lo menos una de física 


ES 
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15. 


16. 


17. 


18. 


19. 


20. 


Sean los dígitos Ш 2,3,4,5,6,7,8, 9), se eligen al azar у con reemplazo 
4 dígitos, para formar un número. Calcular las siguiente probabilidades: 
Obtener un número mayor a 6000 
Obtener un numero par 
Obtener un número mayor a 3000, pero menor a 8000 
Obtener un numero par mayor a 4000 
Obtener un número menor a 3000 o mayor a 7000 
Obtener un 2 
Obtener por lo menos un 2 
una reunión asisten 12 varones y 8 mujeres, se eligen al azar a 5 
ersonas, calcular las siguientes probabilidades: 
Obtener solo varones 
Obtener 3 varones y 2 mujeres 
Obtener por lo menos 2 varones 
Obtener de diferentes sexos 
Obtener que una persona determinada aparezca en el grupo 
Una urna contiene 5 bolitas rojas y 2 bolitas verdes, eligen al azar y con 
reemplazo 4 bolitas. Calcular las siguiente probabilidades: 
a Obtener todas rojas 
b Obtener todas verdes 
с Obtener 2 bojas 
d Obtener por lo menos 1 bolita roja 
e. Obtener de diferentes colores 
U 
a 
b 


>сгоаосо 


аосос 


D 


na moneda es lanzada 10 veces. Calcular las siguientes probabilidades: 
Obtener 3 caras 
Obtener 4 sellos 
с. Obtener por lo menos 1 cara 
Una primera base de datos contiene 40 revistas de física, 50 de 
matemática y 10 de química; una segunda base de datos contiene 40 de 
matemática, 10 de física y 50 de química. Se elige una revista de la 
primera base de datos y luego una revista de la segunda base de datos. 
Cuál es la probabilidad de obtener de la misma materia. 


Una base de datos contiene 40 revistas de física, 50 de matemática y 10 
de química, se eligen al azar y sin reemplazo 3 revistas. ¿Cuál es la 
probabilidad de que la primera revistas sea de química, la segunda de 
física y la tercera de física. 
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CAPITULO 3 
3.1. Variables aleatorias 
En este capítulo, nos interesa una característica cuantitativa de cada resultado 
del experimento aleatorio, con la objeto de generar un modelo probabilístico 


que nos permita tomar decisiones. 


3.2. Definición de variable aleatoria 


Sea € un experimento aleatorio y Q su espacio muestral, una variable 
aleatoria х, es una función que asigna a cada elemento de Q un valor real, 
es decir, 


X 
X:Q>R 
Ejemplo-1 
e= Elegir dos bolitas con reemplazo, de una urna que contiene 1 bolas rojas 


y 1 bola blanca. 
Q = ÍRR, RB, BR, BB} 
En Q definimos la variable aleatoria X, tal como: 


X= Número de bolas rojas presentes= 0, 1, 2 (valores que toma la variable 
aleatoria X) 


Ejemplo-2 

€ = Lanzar una moneda hasta que aparezca la primera cara. 
El espacio muestral es: 

Q =(C, SC, SSC, SSSC,...) 


En О definimos la variable aleatoria X, tal como: 


Х = Número de veces que se tiene que lanzar la moneda hasta que aparezca 
la primera cara, luego la variable aleatoria Х = (ДЕЛЕ Жей 


41 


Ejemplo-3 
€ = Elegir a un recién nacido de un total de 10. 


O=(B,,B,,B,,..., Bio} 

En О definimos la variable aleatoria, tal como: 
X = Peso (Kg) del recién nacido. 

X =fx/x,0<x<10} 


NOTA 


Los valores que toma la variable aleatoria se le llaman recorrido, y se le 


representa por la letra R, . 
3.3. Tipos de variables aleatoria 
Esta clasificación depende de los valores que toma la variable aleatoria X 


a. Variable aleatoria discreta 


Cuando los valores que toma R, , corresponde a un conjunto finito o infinito 
numerable. 


Ejemplo-4 
Ejemplo-1 y Ejemplo-2 


b. VARIABLE ALEATORIA CONTINUA 


Cuando los valores que toma Ж, , corresponden a un intervalo o a un conjunto 
de intervalos. 

Ejemplo-5 

El ejemplo -3 


3.4. FUNCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA 
DISCRETA. 


Sea X una variable aleatoria discreta, con rango R., una función de 


probabilidad de la variables aleatoria X discreta , es una función P(X =x), 
que corresponde a la probabilidad de que la variable aleatoria Х tome un 


valor x en particular, es decir un valor cualquiera de R., P(X =x), debe 
cumplir las siguientes condiciones: 


a 0<Р(Х=х)<1 
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b. 7 Р(Х=х)=1 


xeR, 
NOTA 


Р(Х = х) =0 Para valores que no son de R, 


Ejemplo-4 


Un experimento consiste en extraer con reemplazo dos bolas de urna que 
contiene dos bolas rojas y una bola blanca. Se define a la variable 
aleatoria como el número de bolas rojas presentes en las extracciones. 
Hallar su función de probabilidad: 


С = elegir de una urna que contiene 2 bolas rojas y 1 bola blanca, 2 
bolas con reemplazo. 
О = {R R., RR), К,В, R,R,, R,R,, R,B, BR,, BR,, BB) 


Еп О, definimos la variable aleatoria X= Número de bolas rojas, tal 
como: 


Жей -4012) 
Р(Х =0) = P(BB) = РВ)Р(В) = 1*1 =} 
33 9 
P(X =1) = P(RB o BR) = P(RB) + P(BR) = P(R)P(B) + P(B)P(R) = 


+ 


Р(Х =2) = P(RR) =P(R)P(R) = 441 2 


| 


Estos resultados se representan рог: 


1 X=0 
9 
ы X=1 
Р(Х =x)=49 
4 X=2 
9 
0 para otros valores 


También 


Р(Х = х) = с: GO x=0,1,2 
=0 Рага otros valores que no pertenecen а X. 
De la pregunta anterior 
¿Cual es la probabilidad de obtener por lo menos una bola roja 
i 


P(X>1)=P(X=1 о X=2)=P(X=1)+P(X=2) 
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3.5. Función de densidad de una variable aleatoria continua 


Sea X una variable aleatoria continua que toma valores R., una 


función f(x) derivable e integrable es considerada una función de 
densidad para la variable aleatoria continua X, si esta cumple con las 
siguientes propiedades: 


а. f(x)>0 
b. | да-1 


3.6. Probabilidad de un evento 


Sea X una variable aleatoria con rango КЁ... Supongamos un evento А, 


definido por el intervalo a <x< b, la probabilidad de que ocurra el 
evento A, en otras palabras la probabilidad de elegir un punto del 


intervalo a < х < b , es dado por; 


P(A)= Р(а <х <Б) = | /(х)ах 


3.7. Función de acumulación para una variable aleatoria continua 


Sea X una variable aleatoria continua con rango А, = {- о<х< оо) у 


con función de densidad dada рог f(x). La función de acumulación 
para la variable aleatoria continua es dada por: 


Е(х)= Р(Х <) = | уда 


Ejemplo-5 


Sea X una variable aleatoria continua que corresponde al tiempo de vida 
(minutos) de un organismo, al aplicarse un reactivo químico, cuya 
función de densidad es dada por: 

Ро) = Б? 0<х<1 


=0 para otros valores de х 


a. Calcular el valor de la constante “К”, para que f(x) sea una 
función de densidad. 

b. Sí se elige al azar а un organismo. ¿Cuál es la probabilidad de que 
el organismo tenga un tiempo de vida superior a medio minuto?. 

с. Sí se elige al azar a un organismo. ¿Cuál es la probabilidad de que 
el organismo tenga un tiempo de vida entre medio minuto y tres 
cuarto de minutos. 


а. Hallar la función de probabilidad acumulada para f(x) 
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SOLUCIÓN -1 
1 


1 fas > _ 10 Е 
[годах = оға к 1966-1) =19=3 


0 


Por Іо tanto la función де densidad de probabilidad de la variable 
aleatoria continua es: 


Р(х) = Зх 0<х<1 
=0 para otros valores de х 
SOLUCIÓN -2 


P(X >05) = | за = 5 = (1) — (0,5): = 0.875 
SOLUCIÓN -3 


05 42.2 3 з 3 3 
P(0.5<X<0.75)=| 3x “а = (0.75) – (0.5) = 0.29688 


SOLUCIÓN -4 


х 
3 


Р(Х < х) ЕКІ: =, (х) — (0) = х? 


0 х<0 
Ео)-іх 0<х<1 
1 ж>1 


3.8. Calculo de la media о esperanza matemática de una variable aleatoria 


discreta o continua. 


Sea X una variable aleatoria discreta o continua con rango r con función de 
probabilidad Р(Х = х) о función de densidad f(x), la media de la variable 


aleatoria X es denotada por ЕХ] O и, y definida por: 


ElX ]= Уа =x) si la variable aleatoria X es discreta 
R, 


Elx ]= |, xf(x)dx si la variable aleatoria X ев continua 
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3.9. Esperanza matemática de una función de una variable aleatoria x 


Sea X una variable aleatoria discreta o continua соп rango К соп 
función de probabilidad Р(Х = х) о función de densidad f(x) 
respectivamente. Sea А(х) una función de la variable aleatoria X, luego 


la media de la variable aleatoria h(x) es denotada por Ela] y 
definida por: 


Elh(x)] = Y h(x).P(X =x) si la variable aleatoria X es discreta 
R, 


Eln(x)] = | по) одах si Іа variable aleatoria Х es continua 


3.10. Calculo de la varianza de una variable aleatoria x 


Sea X una variable aleatoria discreta o continua con rango ХА, соп función 
de probabilidad "4 = х) o función de densidad f(x) respectivamente, con 
media de la variable aleatoria X dada рог E[X] o и, , la varianza de la 
variable aleatoria X denotada por V(X) о o? es definida рог: 


vix] = Ze -EQOY.P(X =x) sila variable aleatoria X es discreta 
R, 
v[x] = f (х— Е(Х))* f(x)dx sila variable aleatoria X es continua 


NOTA 


Para una variable aleatoria discreta o continua la varianza también se 
calcula a través de la siguiente fórmula: 


v[x]= Elx”]-(Elx)” 


3.11. El coeficiente de variación 


cr|x]= rix], 100% 


Elx] 


Ejemplo 


Sea X una variable aleatoria que representa los montos por ventas diarias 
(cientos de nuevos soles) de una tienda comercial, cuya función de densidad 


esta dada por: 


. 1 (ох+1) 6<х<12 
(х) =+114 


0 otros casos 
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3.12. 


Calcular el monto por venta promedio 
Е[Х]= f x (х+у& =9.31579 
6 114 | 


Calcular la variabilidad de los montos por ventas 


Ех?]= e Os + D)dx = 89.68421 


V[x]=E|x”]-(E[X]? =89.68421-(9.31579)” =2.90027 


Hallar el coeficiente de variación de los montos por ventas 


cv[x]= үр] *100% = 220027 +100 =18.28% 
Elx] 9.31579 


Ejercicios propuestos 


Suponga que el diámetro(cms.) de los cabes eléctricos producidos en un 
día producidos por una fábrica es una variable aleatoria con función de 


densidad dada por: 


x-1 
k 


1<х<2 


Год- 2 2<х<2.5 
6- 2х 2.5 <х<3 
0 otros valores 


Calcular el valor de la constante "k" рага que f(x) sea una 


función de densidad. 


Se elige al azar un cable cual es la probabilidad de que su diámetro 
sea superior a 1.5 cm. 

Supongamos que se elige al azar un cable y tiene un diámetro 
mayor que 2 cm. ¿Cuál es la probabilidad de que tenga un diámetro 
menor a 2.5 cm. 

Calcular e interpretar la media y desviación estándar del diámetro. 
Si la función de producción mensual esta dada por у =8x+3. 
Halle el coeficiente de variabilidad de la producción mensual. 

Un cable se considera defectuoso si su diámetro es inferior a 2.4 cm. 
Si el jefe de control de calidad selecciona 4 cables en forma 
aleatoria con reemplazo.¿ Cuál es la probabilidad de que 3 de ellos 
sean defectuosos? 


Sea X, una variable aleatoria definida como el número de televisores 
vendidos por día en cierta tienda comercial, la cual tiene la siguiente 
función de probabilidad: 
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k x=1,2 

1 

= =3,4 
қыла +57 

2k x=5,6 

0 otros valores 


a. Hallar el valor de “К”, рага que Р(Х = х) sea una función de 
probabilidad. 

b. Hallar la media y varianza de X 

с. ¿Cuál es la probabilidad de que se vendan menos de 4 televisores 
en un día. 

d. Сі ве han vendido más de З televisores еп un día. ¿ Cuál es la 
probabilidad de que se vendan menos de 5 televisores en ese día? 


e. Sea ? 1.2х +3 representa el costo por fabricar cada televisor, 
hallar la media y su varianza 


f: Sea 75 7.5x +0.25 representa la utilidad (ganancia por cada 
televisor) Hallar su media y coeficiente de variación. 

g. Dela pregunta (e). ¿Cuál es la probabilidad de que el costo sea a lo 
más 9. 


Una urna contiene dos bolitas, la 1ra. con el número 5 y la segunda con el 
número 3, se extrae 2 bolitas con reemplazo. Se define a la variable 
aleatoria X = suma de los resultados, Hallar el coeficiente de variación. 


En la maternidad de Lima, el peso ( Kg.) de los recién nacidos es una 
variable aleatoria , cuya función de densidad es dada por: 


Ж 2<х<4 


0 otros valores 


a. Hallar el coeficiente de variación. 

b. ¿Cuál debe ser el mínimo peso de un recién nacido para ser 
considerado dentro del 90% de los que tienen mayores pesos. 

с. Se eligen a dos recién nacidos. ¿Cuál es la probabilidad de que 
ambos tengan un peso superior a los 3 Kg. 

d. Después de cierto tiempo el peso de los recién nacidos se 
incrementan de acuerdo a la siguiente función y=1.25x+0.25 , 


Hallar el nuevo peso promedio. 
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CAPITULO 4 


4.1. Principales distribuciones discretas 


En este capítulo, se presentan algunos modelos probabilísticos para variables 
aleatorias discretas, tales como las Bernoulli, Binomial, Hipergeométrica y 
Poisson. 


4.2. Distribución Bernoulli 


Sea una población finita de tamaño Л, que presenta solo dos característica 
tales como 4 y B, con n(A) у n(B)elementos respectivamente, 
supongamos que se extrae un solo elemento de la población, tal que la 


ra- 2p y la e) = 0 AA ipg, definimos a la variable 


. r РЕТ, " " 
aleatoria X= número de elementos que presenta la característica А" en 
una sola extracción, luego la variable aleatoria toma solo dos valores posibles 
el cero y el uno; es decir: 


X=0,1 (“0” indica que no presenta la característica " 4" y “1” que presenta 


la característica "А" ) 


Р(А) = Р(Х =1) = р 
Р(В)= Р(Х = 0) =4 


Matemáticamente la función de probabilidad para Іа variable aleatoria X : 
Р(Х-х-рч Х-0,1 
= 0 para otros valores 
Teorema-1 
Por la definición de la media y varianza de una variable aleatoria se tiene que: 
E(X) =p y У(Х) = рд 
Теогета-2 


La sumatoria ае las probabilidades, para todos los valores que toma la variable 
es igual a la unidad 


Y PAX =x)=1 
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га 9 


En una fábrica de zapatillas el 9% ае la producción diaria corresponden a 
zapatillas para varones y el 10% para mujeres. Se elige una par de zapatillas al 
azar; presentar la función de probabilidad para la variable aleatoria X = número 
de zapatillas para varones. 


Definimos a la variable aleatoria X = número de zapatillas para varones en una 
sola extracción = 0,1 


Р(уагоп) = P(X =1)=0.9= p 
P(mujer)= P(X =0)=0.1=q 


Luego: 


T A x=0, 1 


para otros valores que no sea cero ni uno 


4.3. Distribución Binomial 


De lo expuesto en la distribución Bernoulli, si de esta población se extraen en 
forma aleatoria y con reemplazo “M” elementos, y se define a la variable 


aleatoria X = números de elementos que presentan la característica “ 4” en 
las “П” extracciones, luego la variable aleatoria X pude tomar los siguientes 
valores: X =0,1,2,3,...,nN. Si а la probabilidad де que presente la 
característica “ Á” se le llama la probabilidad de obtener un éxito, y se 
representa рог“ p ” y que no presente la característica “ 4” por “q = 1- р” 
se tiene que la función de probabilidad para esta variable aleatoria Х es: 

Р(Х =х)= x=0,1,2,...,n 


para otros valores 
Teorema-1 


Por la propiedad de la media y la varianza para una variable aleatoria discreta 
se tiene que: 


E(X) = пр 
У(Х) = пра 
Теогета-2 


La sumatoria de las probabilidades, para todos los valores que toma Іа variable 
es igual a la unidad 


Y PX =x)=1 
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Ejemplo 

Una fábrica produce zapatillas, la probabilidad de que un par de ellas tenga 
defectos es 0.01, se elige al azar y con reemplazo 15 pares de zapatillas. 
¿Cuál es la probabilidad de que por lo menos 2 pares de zapatillas tengan 
defecto. 

Sea X= Número de pares de zapatillas con defecto en la muestra. 


Х-0, 1, 2, 3, .., 15. 


Сото Іа variable aleatoria X corresponde al número de defecto, calculamos la 
probabilidad de obtener un defecto como éxito, luego: 


P(defecto)=0.01 
P(sin defecto)=0.99 


La función de probabilidad para este caso es: 


Р(Х =x)= С^ (0.01)°(0.99)”* x = 0,1,2,...,15 
= 0 para otros valores 


La probabilidad pedida es: 


1 
P(X 22) =1- P(X <2)=1-)'C*(0.01)'(0.99)'** -1-0.990370226 = 0.009629773 


x=0 


4.4. Distribución Hipergeométrica 


De una población de tamaño N, que presentan 2 característica A, con N(A) 
elementos y la característica B con N(B)=N-N(A) elementos, se extrae una 
muestra aleatoria de tamaño “п” sin reemplazo, y se define la variable aleatoria 
X = número de elemento en la muestra que presenta la característica A. 


La función de probabilidad para este caso es: 


См N(B) 
== EX max(0,n—N +N(4))<x<min(N(4),n) 


0 para otros valores 


Teorema-1 


La media y varianza de la variable aleatoria que sigue una Distribución 
hipergeométrica son respectivamente: 


_, NA 
E(X) = п. үт 

_ п(А).М(В) N-n 
V(X)=n. E ( al ) 
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Teorema-2 


La sumatoria de las probabilidades, para todos los valores que toma la variable 
es igual a la unidad 


Y PX =x)=1 


Ejemplo-1 


En una reunión asisten 3 varones y 7 mujeres, se elige al azar 5 personas 
sin reemplazo .¿ Cuál es la probabilidad de elegir a 2 varones? 

Sea la variable aleatoria X = número de varones elegidos en la muestra de 5 
personas =0, 1, 2, 3. 


2 7 
Р(Х = х) = GE x = 0,1,2,3 
5 
3 7 
Р(Х = 2) = Es С = 0.41666 
5) 
Ejemplo-2 


Del ejemplo anterior ¿Cuál es la probabilidad de elegir 2 mujeres en las 5 
extracciones sin reemplazo? 

Sea la variable aleatoria Y = elegir de la muestra de tamaño 5 a 2 mujeres = 2, 
3, 4, 5. 


y ы 2,3,4,5 


T 3 
Р(Ү =2у= ©? Сва = 0.08333 
С; 


Ejemplo-3 


Una caja contiene 12 repuestos para TV, de los cuales 4 tienen desperfecto y 8 
funcionan correctamente, se extrae 6 repuestos en forma aleatoria sin 
reemplazo. Se define a la variable aleatoria Х = М? de repuesto para TV con 
desperfecto; calcular: 


1. La probabilidad de obtener 2 repuestos con desperfecto 


4 8 
Р(Х =х)= © Lex Ж-0,1,2%4 
6 
4 (8 
Р(Х =2)= сые: = 0.45456 
6 
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2. La probabilidad de obtener por lo menos un repuesto con desperfecto. 


0 4 8 
Р(Х >21) =1- Р(Х <1) =1- Es Le = 0.96970 
х-0 6 
3. La media de la variable aleatoria. 
X (0) 1 2 3 4 


Р(Х = х) | 0.0303 0.24242 | 0.45456 | 0.24242 0.0303 


4 
Elx] = Nx PX = х) = 0 * 0.0303 +1*0.24242 + 2 * 0.45456 + 3 * 0.24242 + 4 * 0.0303 


x=0 


Elx]= 922 -х)-2 


х-0 
También рог la fórmula: 


МА) A 
EX) =n = 60) =2 


Ejemplo-4 
De la pregunta anterior se define a la variable aleatoria Y = М? de repuestos 


para TV que funcionan correctamente; Hallar la probabilidad de obtener 5 
repuestos que funcionan correctamente. 


Y=2,3,4,5,6 
8 (4 
y" “6-y 
P(Y =y)= Ca y =2,3, 4,5,6 
6 
8 (4 
P(Y = 5) = 6 Los = 0.242424 
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4.5. Distribución poisson 


Sea X una variable aleatoria discreta que toma valores  X=0,1,2,3....,00 


ocurrencias de eventos en el intervalo (a , b) o región, si definimos por y, 
como el número promedio de ocurrencia de eventos en el intervalo o región. Se 
elige un intervalo o región al azar, la probabilidad de ocurrencia de X=x 
eventos está dada por: 


Е 


D 
P(X = х) = “E X=01,2,...,00 
х: 


= 0 Para otros valores 
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Dónde: 


и =número promedio de ocurrencia de eventos en los intervalos o regiones de 
estudio. 
e = 2.718281828...раѕе de logaritmo neperiano. 


Teoremas 


La media y varianza de la variable aleatoria que sigue una Distribución de 
Poisson son respectivamente: 


EX) =u 
VA =u 


Ejemplo 


El número de llamadas telefónicas en la central de radio patrulla de la Policía 
Nacional, es en promedio 5 cada 15 minutos, se elige al azar un intervalo de 
15 minutos. Hallar las siguientes probabilidades: 


a. Que ocurra 2 llamadas telefónicas en 15 minutos 
b. Que ocurra por lo menos 2 llamada telefónicas en 15 minutos. 
с. Que ocurra 4 llamadas telefónicas en 18 minutos 


La función de distribución de poisson para este caso es: 


-5 gx 
Pea x=0,1,2,... 
х! 
Solución de (а) 
е 52 
Р(Х = 2) = Т = 0.084224 
Solución de (b) 
кее EA i x=0,1,2,...,00 
= х 


Este valor lo calculamos por complemento 


рх>2)-1-у< 


х=0 


5 0.959572 
х! 


Solución de (с) 
Si 5 es el promedio de llamadas en 15 minutos, luego el promedio de llamadas 
en 18 minutos lo obtenemos a través de una regla de tres simple es decir; 
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5 promedio de llamdas >15 minutos 
u > 18 minutos 


и=6 llamadas telefonicas en 18 minutos 


La probabilidad de que ocurra 4 llamadas telefónicas 


-6 4 
Р(Х = 4) = 2-2 = 0.133853 
4! 


Га distribución de Poisson permite calcular probabilidades de la distribución 
binomial, para cuando “р” es pequeño y “п” grande. En la práctica la 


aproximación es buena cuando “n” es mayor a 50 y el valor de “p” menor a 0.1; 
es decir cuando np >5, para esto se debe considerar ¿ = пр 


Ejemplo 


En una biblioteca, el 6% de las revistas científicas de físicas están 
deterioradas, se elige una muestra al azar con reemplazo de 100 revistas. 
Cuál es la probabilidad de que 5 revistas científicas de físicas se encuentren 
deterioradas. 


Utilizando la distribución binomial 


Р(Х = x) = C™ (0.06)* (0.94) 
P(X =5)=C!"(0.06)*(0.94)” = 0.16392 


En este caso n = 100 > 50 y el valor de р = 0.06 < 0.1, luego se puede 


usar la distribución de poisson соп Ш = пр =100(0.06) = 6, para aproximar 
probabilidades de la distribución binomial. 


Utilizando la distribución Poisson 


и = пр =100(0.06) = 6 


е 6* -6 6? 


РХ =)= P(X =5= = 0.16062 


Ejemplo 

Una población está compuesta de 200 revistas científicas de física y 4800 de 
química, se eligen al azar y con reemplazo 200 revistas. Cuál es la probabilidad 
de obtener 6 revistas de físicas. 


Utilizando la distribución binomial 


Р(Х =x)=C?”(0.04)"(0.96)%>* 
Р(Х =6)=C¿”(0.04)(0.96)'” = 0.12273 
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En este caso и = 200 > 50 y el valor de p=0.04<0.1, luego se puede 


usar la distribución de poisson con Ш = пр = 200(0.04) = 8, para aproximar 
probabilidades de la distribución binomial. 


Utilizando la distribución Poisson 


и = пр =200(0.04) =8 


е g“ e? 8° 
РХ =х) = 2—9 Р(Х =6) = == 0.12214 
xX! Н 


4.6. Ejercicios propuestos 


1 Sea  X=B(6,0.25) 
Hallar: 


Elx?] 

V[x +1] 
ElX +2] 
Е[Х(Х +D)] 


ассо 


2 Sean los dígitos: 1, 2, 3, 4, 5, 6, 7, 8, 9, se eligen tres dígitos al azar con 
reemplazo, para formar un número. Cuál es la probabilidad de que 2 
dígitos sean mayores a 4. 


3 De una población de 1000 revistas científica en computación, se sabe 
que 500 están escritas en idioma inglés, 200 en español y 300 en 
portugués. Se elige una muestra de 5 revistas al azar con reemplazo. 
Calcular las siguientes probabilidades: 


a. Obtener dos revistas en español 
b. Obtener por lo menos dos revistas en idioma portugués 
с. Obtener una o tres revista en idioma inglés. 


4 El promedio de usuarios que concurren a un centro de información en una 
hora es de 10 usuarios, se elige al azar un intervalo de una hora cual es la 
probabilidad de que ingresen 14 usuarios. 


5 De una población de 1000 revistas científica en computación, se sabe 
que 600 están escritas en idioma inglés, 400 en portugués. Se elige una 
muestra ае 5 revistas al azar con reemplazo. Calcular las siguientes 
probabilidades: 


a. Obtener tres revistas en ingles 
b. Obtener solo una revista en español o solo una revista en portugués. 


6 El promedio de usuarios que concurren a un centro de información en una 
hora es de 10 usuarios, se elige al azar un intervalo de una hora cual es la 
probabilidad de que ingresen más de un usuario. 
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10 


11 


12 


Una base de datos tiene 4 revistas científicas de física y 6 de 
matemáticas. Se eligen al azar y sin reemplazo 6 revistas. ¿Cuál es la 
probabilidad de obtener por lo menos 2 de física. 


Una jaula contiene 4 conejos blancos y 8 conejos negros, se extrae 6 
conejos al azar sin reemplazo, Hallar las siguientes probabilidades: 


Obtener 4 conejos blancos 
Obtener por lo menos un conejo blanco 
Hallar su media de la variable aleatoria 
Obtener 2 conejos negros 


apg 


El número promedio de lombrices en un terreno de cultivo de 8 metros de 
largo y 3 metros de ancho es de 80. Se elige en el terreno en forma 
aleatoria un área de 12 metros de largo y 5 de ancho. ¿Cuál es la 
probabilidad de encontrar por lo menos 4 lombrices?. 


Una fábrica confecciona polos, de los 5000 polos confeccionados 50 
tienen falla, se extrae una muestra con reemplazo de 60 polos cual es la 
probabilidad de obtener 2 con falla. 


Una base de datos contiene 3 revistas científicas en idioma inglés y 7 
revistas en idioma español, se eligen al azar y sin reemplazo 5 revistas. 
Cuál es la probabilidad de obtener por lo menos 3 revistas en español. 


Una base de datos está compuesta de 300 revistas de computación, 200 
de física y 500 de matemáticas, se eligen al azar y con reemplazo 10 
revistas. ¿Cuál es la probabilidad de obtener por lo menos una de 
matemática? 
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CAPITULO 5 


5.1. Principales distribuciones continuas 


En este capítulo, se presentan algunos modelos probabilísticos para variables 
aleatorias continuas, siendo: la distribución Normal, Normal Estándar, Т- 
Student, Chi-Cuadrado y F Snedecor 


5.2. Distribución normal 


Una Variable aleatoria continua X, que toma todos los valores de la recta real, 
se dice que tiene una distribución normal con media poblacional y y varianza 


poblacional с? , si su función de densidad está dada por: 


1 y 
—— e ? * —-0<X<0 
v270 


= 0 para otros valores 


тоша) 


Nota: 


2 әлі А А А 
f(x; 1,0”), es una función de densidad, ya que se cumple con las siguientes 
condiciones: 


a) f(x; puo?)>0 
D [Sæm d=] 


La primera condición implica que la función de densidad normal se encuentra 
en el | y Il cuadrante del plano cartesiano. 


La segunda condición implica que el área limitada por la curva normal y el eje 
X, es la unidad o el 100%. 


5.3. Propiedades de la distribución normal 


a. Es asintótica con respecto al eje X 
b. Es simétrica con respecto al eje X = 4 


с. Si X, tiene una distribución normal con media Ш y varianza o? se elige 
al azar un valor de la recta real, la probabilidad de que este valor provenga 
del intervalo (a,b), es igual al área, limitado por la curva y las 
perpendiculares levantadas en los puntos a y b que pertenecen al eje de la 
abscisa, es decir: 


х-и. 


o dx>0 Va<b 


1 --( 
е 
у2лс 


а. La probabilidad en un punto es сего Р(а < х < а) = Р(х= а) = 0 


b 
Pla<x<b)=| 
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e. Para una variable aleatoria continua X, la probabilidad de que un punto 


de la recta real se encuentre en el intervalo (a > b) , esta dado por cuatro 
formas equivalentes: 
Pla<x<b)=Pla<x<b)=Pla<x<b)=P(a<x<b) 


f. Sea X una variable aleatoria con distribución normal, con media Ш у 
varianza с”, las siguientes afirmaciones son verdaderas: 


e Р(и-с<х<ш-о)-0.68269 
e  Píu-20<x<u+20)=0.9545 
e  P(u-30<x< +30) = 0.9973 


Notación: 


Cuando una variable aleatoria X tiene una distribución normal con media 4 y 
varianza с>, se representa simbólicamente рог: X-N(u,o?), se lee la 
variable aleatoria X se distribuye (-) Normalmente (№) con media 
poblacional Ш y varianza poblacional o°. 


5.4. Distribución normal estándar 


Una Variable aleatoria continua Х, que toma todos los puntos de la recta real, 
se dice que tiene una distribución normal estándar si su media poblacional es 


н-0 y varianza poblacional с> =1, a esta variable aleatoria se le 
representa con la letra Z, y su función de densidad es: 


F(;0,1) = aL =0<z<0 
2л 


El área bajo la curva es igual a la unidad, es decir 
[ f(z;0,1)dz=1 


GRAFICA DE LA DISTRIBUCION DE UNA VARIABLE ALEATORIA 
NORMAL ESTANDAR 
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5.5. Uso de la tabla “z” 


La tabla 27, permite calcular probabilidades acumulada de la distribución 
normal estándar desde — оо, hasta un valor de abscisa cualquiera 2, (уег 
anexo), es decir: 


EN A ш fe 22% 
2” 
Ejemplo-1 


Sea Z una variable aleatoria con distribución normal estándar. Se elige un valor 
Z al azar. ¿Cuál es la probabilidad de que el valor elegido sea inferior o menor 
a z, = –1.25?. Esto equivalente a plantear 


P(—œ < Z <-1.25) = P(Z <-1.25) =0.1056 , valor que se obtiene de la tabla Z 
negativa (ver anexo) 


La tabla que se anexa, se ha construido para calcular probabilidades de – оо 
hasta un valor 2,, es decir para valores de Z, menor а. Si fuera para mayor, se 
calcula por diferencia, es decir al todo se le resta la probabilidad para menor a. 


Para el ejemplo 1, se busca en la tabla Z para valores negativos acumulados. 
La probabilidad pedida es la intersección del valor -1.2 (fila) y el valor -0.05 
(columna) , que es igual a 0.1056. 


-0.05 2 


0.1056 -1.2 


Notación: 


A esta probabilidad acumulada se le representa por: Z -1.25 


(0.1056) “ 


Ejemplo-2 


Se elige al azar un valor Cuál es la probabilidad de que el valor elegido sea 
inferior a 1.257. Esto es equivalente a plantear 
Р(-о<2 <1.25) = P(Z <1.25)- 0.8944, valor que se obtiene de la tabla Z 


positiva 


ЙА 
7 0.05 
1.2 0.8944 
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Ejemplo-3 


Se elige un valor Z al azar ¿Cuál es la probabilidad de elegir Z superior a 
1.257, esto es equivalente a plantear 


Р(2 >1.25) >P(Z <1.25 04 >1.25) =1, por ser eventos excluyentes se tiene: 
P(Z <1.25)+P(Z >1.25)=1 > Р(Х >1.25) =1- P(Z <1.25) 
Р(2 >1.25)=1- P(Z < 1.25) = 1- 0.8944 = 0.1056 


Ejemplo-4 


¿Cuál es la probabilidad de elegir un valor Z entre -1.25 y 1.257, esto es 
equivalente a plantear 


P(-1.25< Z <1.25) = Р(Х <1.25) -P(Z <-1.25) 
P(=1.25<Z < 1.25) = 0.8944 – 0.1056 = 0.7888 


En general: 

Sean a y b números reales, tal que a< b, se tiene: 
Pla<Z<b)=P(Z<b)-P(Z<a) 

TEOREMA 


Sea X una variable aleatoria con distribución normal con media / y 


š 2 . б 14 н A 
varianza O”, la siguiente relación transforma a la variable X en una variable 
normal estándar Z, es decir: 


La media 


Ey E OA НА _0 


с 
La varianza 
X- V(X)-V о:-0 
с б б 
Luego: 


пан 


~ №0 ,1) 


Al proceso de transformar una variable aleatoria con distribución normal con 


. А 2 А А 
media Ш у varianza С а una variable normal estándar, se llama 


estandarización. Esta transformación nos permite calcular probabilidades de 
eventos de cualquier distribución normal. 
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Ejemplo-1 
Los montos diarios por ventas de un grifo que expende combustible para 
vehículos, se distribuyen normalmente con media 20,000 nuevos soles y 


desviación estándar 2000 nuevos soles. ¿Cuál es la probabilidad de que en un 
día cualquiera el monto diario por venta supere a los 21,000 nuevos soles?: 


Sea Х = топіоѕ de ventas ~ N(20,000 ; 2,000?) 
La probabilidad pedida es: 


Х-и > 21,000 – 20,000 
2,000 


Р(Х > 21,000) = P( ) = Р(2 > 0.5) 


Р(Х > 21,000) = P(Z > 0.5) =1- Р( < 0.5) =1-0.691462 = 0.30854 


Ejemplo-2 


Del ejemplo anterior, ¿Cuál es el mínimo monto de venta, para que un monto 
diario por venta se encuentre considerado dentro del 2.5% de los montos 
mayores por ventas?. 


Planteamiento 


Una distribución normal se puede dividir en tres partes: la primera, la cola 
izquierda donde ocurren pocos montos por ventas menores; la segunda, la 
parte central donde ocurren los montos por ventas más frecuentes y la tercera 
parte la cola derecha donde ocurren pocos montos por ventas mayores. 


Sea M el mínimo valor de los montos por ventas mayores, luego la probabilidad 
de encontrar montos por ventas mayores a M es por dato 2.5%(0.025), 
entonces planteamos la siguiente relación: 


P(X > М) =0.025 


Х-и ED, -pizz PE 2000 


P(X>M)=P( 
т 2,000 2,000 


) = 0.025 


p(z > М. 20000 21 pez < М 20000). 0,025 > pez < 120000, _ y975Dela tabla Z, un 
2,000 2,000 2,000 


valor de abscisa que acumule una probabilidad de 0.975 es: 1.96, luego 


M - 20,000 
2,000 


=1.96 > М = S /.23,920 


Es decir, S/.23,920, es el mínimo monto por ventas, рага los montos mayores. 


5.6. Ejercicios propuestos 


1. P(2125<Z<135) 
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15. 
16. 


17. 


Р(—125< 7/7 <125) 


P(|Z| < 1.25) 


Р(-125<7<0) 


P(Z<-1.25UZ >1.25) 


Р(0<2<125) 


P(-2.45 < Z <-1.25) 


P(Z <-1.000Z <-1.25) 


Р(2 <0.25/2 <1.25) 


Р(-125<2<-1.00) 


P(Z >-1.25) 


P(0.25<Z <1.25) 


Р(0<7<5) 


Р(-5<27<5) 


Р(2 < –5) 


Sea Z una variable normal estándar, se extrae un solo valor, Hallar las 
siguientes probabilidades: 


аосш 


¿Que el valor sea superior a 1.368? 

¿Que el valor se encuentre entre -1.253 y 2.366? 
¿Que el valor sea inferior а 3.212. 

Hallar el valor de “a” en la ecuación: 


P(+1.23<Z <a) = 0.8873 


Suponiendo normalidad para la variable número de artículos por revistas 
científicas, se sabe que la media de artículos es de 6.4 y su varianza 
5.31. Se elige al azar una revista, Hallar las siguientes probabilidades: 


a. 
b. 
с. 


¿Que el número de artículos sea superior a 5? 

¿Que el número de artículos se encuentre entre 4 y 7? 

¿Cuál es el mínimo número de artículos que debe tener una revista, 
para estar considerado dentro de 20% ае los que tienen mayor 
número de artículos?. 

Si la base de datos tiene 1200 revistas que cantidad de revistas 
aproximadamente tienen menos a 8 artículos. 
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18. Deuna distribución normal estándar se eligen 5 valores al azar. ¿Cuál es 
la probabilidad de que dos de ellos sean superior a 1.367. 


5.7. Distribución chi-cuadrado 


Una variable aleatoria continua X, que toma valores reales positivos, se dice 
que tiene una distribución Chi-Cuadrado con v grados de libertad, si su función 
de densidad es dada por: 


у2 х 
2 x>0 


Гоз) = Lx 
210) 
2 


Siendo: 
v 
O La función gamma, definida por: 
у Е 00 >! БУ 
(2513 еу у> 


Además, Г(а +1) = а!, donde “a” es ип número entero positivo. 


NOTACIÓN: 


Si X es una variable aleatoria con distribución Chi-Cuadrado con v grados de 
libertad, se denota universalmente por: 


X ~ Жош 


Esta función Chi-Cuadrado tiene las siguientes características: 


a. Está definida solo para valores positivos. 

b. Su grafica presenta una asimetría y asíntota a la derecha. 

с. La función tiende a ser simétrica a medida que los grados de libertad v 
tiende al infinito, en la práctica se cumple para у>30. 


5.8. Concepto de grados de libertad 


Sea Х,,Х,,Х,..Х,|,Х,, una muestra aleatoria de tamaño n y X la media 
aritmética que estima al parámetro y, entonces se tiene la libertad de elegir 


cualquier valor para los n—1valores de la muestra y el valor de la variable 
faltante se restringe al valor de la media. En general el concepto de grado de 
libertad se relaciona al tamaño de la muestra n y el número de parámetros que 
se estima. 


TEOREMA-1 


Sea X una variable aleatoria con distribución Chi-Cuadrado con v grados de 
libertad, luego tiene por media y varianza: 


64 


Е(Х) =v 
V(X) = 2v 


NOTA 


La función de distribución acumulada es dada por: 


PX<x=F(X=x3=> | x? е?а 
z у 
22 гуу? 
С) 


5.9. Uso de la tabla chi-cuadrado 


La tabla para la distribución Chi-Cuadrado, ha sido elaborada para calcular 
probabilidades acumuladas desde 0 hasta un valor de abscisa cualquiera. 


Ejemplo-1 


Sea X ,una variable aleatoria que se distribuye con una Chi-cuadrado con 
20 grados de libertad, ¿cuál es la probabilidad de encontrar un valor Chi- 
cuadrado inferior a 31.4102; del anexo, se tiene: 


rob.Acum. 


GL 0.95 


20 31.410 


De la tabla la probabilidad pedida es: 

Р(Х <31.410)- 0.95 

Notación: 

A esta probabilidad acumulada se la representa por: a = 31.410 
Ejemplo-2 

Sea X ,una variable aleatoria que se distribuye con una Chi-cuadrado con 
30 grados de libertad, cual es la probabilidad de encontrar un valor Chi- 


cuadrado entre 18.4927 y 46.9792; es decir, 


Р(18.4927 < X < 46.9792) = Р(Х < 46.9792) — Р(Х <18.4927) 
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rob.Acum 


GL 0.05 0.975 


30 18.4927 46.9792 


De la tabla Chi-cuadrado, las probabilidades acumuladas рага 30 grados de 
libertad, para valores de abscisa de 46.9792 y 18.4927, son respectivamente 
0.975 y 0.05, entonces: 


Р(18.4927 < Х < 46.9792) = 0.975— 0.05 = 0.925. 
ТЕОКЕМА- 2 
Sea X una variable aleatoria con distribución Chi-Cuadrado соп п grados de 


libertad, cuando el número de grado de libertad tiende a ser muy grande, en la 
práctica para n>30; la variable aleatoria 


Z=WxV2x-V/2n-1-N(0:1) 


Ejemplo-1 
Sea X una variable aleatoria que se distribuye como una Chi-Cuadrado con 


300 grados de libertad, cual es probabilidad de elegir un valor superior a 350. 


Р(х > 350) = P(2x > 700) = Р(У2х > /700) = 
Р(х > 350) = Р(4/2х – 4/2*300-1 > 4700 – /2*300-1) = P(Z >1.98) 
Р(х > 350) =1- Р(Х <1.98) =1-0.9761 = 0.0239 


Ejemplo-2 


Sea X una variable aleatoria que se distribuye como una Chi-Cuadrado con 
120 grados de libertad, ¿Qué valor superior se elige con probabilidad 0.05? 


Р(х > а) = 0.05 = P(2x > 2а) = Р(У2х > М2а) 
Р(х > а) = Р(/2х —/2*120-1 > 42а —/2*120—1) = P(Z > {2а -/2*120-1) 


Р(х > a) =P(Z >,2а-,239)-1-Р(2 < 42a – 4239) = 0.05 
P(Z < 42а —-/239) =1—0.05 = 0.95 > /2a —-/239 =1.64 > а =146.1985 


Ejemplo-3 


50 
Sea М ~ Loa , calcular el valor de PO M, > 240) 


i=l 
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Ya, > EM > ~ М(Е(М); raD) M-> ~ №6; 2262 (6;0.24) 
z M, 240 4.8-6 
РУМ, > 240) = RET > Р(М > 4.8) = Р(х > 


11 v0.24 


48-6) рс >-2.45)=1-— P(z < -2.45) = 1 — 0.0071 = 0.9929 


v0.24 


) 


P(z> 


5.10. Distribución t-Student (distribución de w. Gosset) 


Una variable aleatoria continua X, que toma todos los puntos de la recta real, 
tiene una distribución T de Student con v-grados de libertad, si su función de 
densidad es dada por: 


| -о<х<о v>0 


La distribución T, es simétrica con respecto al origen de coordenadas, y su 
función de densidad tiene un valor máximo cuando x=0, la forma de la función 
de densidad es muy similar a la densidad normal estándar y con los extremos 
de la distribución t menos pronunciados que los de la distribución normal. 
Conforme se tiene un número mayor de grados de libertad, la distribución t de 
Student tiende hacia la distribución normal estándar. Se demuestra que el área 
bajo la curva es igual a la unidad y que tiene por media y varianza dado por: 


E(X)=0 v>1 


v 
V(X)= ,>2 
Mes" 


NOTACION 


Si una variable aleatoria X, tiene una distribución t-Student соп “у grados de 
libertad, se denota universalmente por: 


Х-4 


ШІ 


La distribución de probabilidad acumulada de la distribución t-Student es dada 
por: 


5.11. Uso de la tabla 


El uso de la tabla, para la distribución T-Student, ha sido elaborado para 


calcular probabilidades acumuladas desde — ОО hasta un valor de abscisa 
cualquiera. 
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Ejemplo-1 


Sea X ,una variable aleatoria que se distribuye con una T-Student con 20 
grados de libertad. ¿Cuál es la probabilidad de encontrar un valor de abscisa T- 
Student inferior a 1.725, de la tabla: 


rob.Acum 


GL 0.95 


20 1.725 


P(X <1.725) =0.95 


Notación: 
A la probabilidad acumulada se la representa por: Тоз.) = 1-725 


Ejemplo-2 
Sea X ,una variable aleatoria que se distribuye con una T-Student con 30 


grados de libertad. ¿Cuál es la probabilidad de encontrar un valor de abscisa T- 
Student entre -1.697 y 2.0427; es decir, 


Р(-1.697< X < 2.042) = Р(Х <2.042)- Р(Х <-1.697) 


La tabla T-Student proporciona probabilidades acumuladas para 30 grados 
de libertad y valores de abscisa de 2.042 y -1.697; es decir, 


rob.Acum 


0.05 0.975 
GL 


30 -1.697 2.042 


Р(-1.697< X < 2.042) = 0.975 – 0.05 = 0.925 


ТЕОКЕМА 1 


Sea Z una variable aleatoria normal estándar у W una variable aleatoria Chi- 
Cuadrado con v-grados de libertad. Si Z y W son variables aleatorias 
independientes, entonces la variable aleatoria: 
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ы 


Х---- 
W 
v 


Tiene una distribución T-Student con v-grados de libertad. 


5.12. Distribución F( Snedecor) 


Una variable aleatoria continua X, que toma valores reales positivos, se dice 
que tiene una distribución F-Snedecor con k, y k, grados de libertad, si su 


función de densidad es dada por: 


г К, +k, рар 
2 Е ka |? 
fo; kpk) = A (5? x? [l+Hx x>0 
rr + : 


Esta función tiene las siguientes características: 


a. Está definida al igual que la distribución Chi-Cuadrado solo para valores 


positivos. 


b. Su gráfica presenta asimetría a la derecha y asíntota al eje de la 


abscisa. . 


c. La función tiende a ser simétrica a medida que los grados de libertad 
k y k, tiende al infinito, еп la práctica se cumple рага 


k >30 y k,>30. 


Notación 


Si una variable aleatoria X, tiene una distribución F-Snedecor con k, y k, 


grados de libertad, se denota universalmente por: 


X 


~ For, СӘ 
Siendo: 


k,= grados de libertad del numerador 
к, = grados de libertad del denominador 


TEOREMA-1 


Sea X una variable aleatoria con distribución F-Snedecor (k, 


grados de libertad, luego tiene por media y varianza: 


k, 


E(X) = >k, >2 
7 2 2 


2 
2kè(k, +k, —2) 


7 > к, > 4 
k, (К, =2) (k, -4) 


V(X)= 


у k) 


67 


TEOREMA-2 


Sea X una variable aleatoria con distribución Е con (k, у  k,), la inversa 
de la variable aleatoria, tiene también una distribución F con grados de liberad 
(k, у А); ев decir, 


TEOREMA-3 


Sean V y W dos variables aleatorias independientes con distribución Chi- 
cuadrado con k, y k, grados de libertad, respectivamente. La variable 
aleatoria dada por: 


5.13. Uso de la tabla 
Ejemplo-1 
Sea X , una variable aleatoria que se distribuye con una F-Snedecor con ( 3 


y 5 ) grados de libertad, Hallar un valor de abscisa que acumule una 
probabilidad del 0.95; (ver anexo). 


L Numerador 
1 2 3 4 5 6 
GL 
Denominado 
1 
2. 
3 
4 
5 3,6195 
5,4095 
12,06 
6 
7 
Р(Х <M)=0.95 


Siendo M un valor de abscisa que acumula una probabilidad del 0.95. La tabla 
F, proporciona para un par de grados de libertad tres valores de abscisa, 
siendo el primer valor correspondiente a una probabilidad acumulada de 0.90, 
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el segundo valor corresponde a una probabilidad acumulada de 0.95 y el tercer 
valor a una probabilidad acumulada del 0.99, luego de la tabla para una 
probabilidad acumulada del 0.95 le corresponde un valor de abscisa igual a 
5.4095; es decir, 


M =5.4095 


Notación 
A esta probabilidad acumulada se le representa por: Ёз.) = 5.4095 


Ejemplo-2 


Sea X ,una variable aleatoria que se distribuye con una F-Snedecor con ( 3 y 
5 ) grados de libertad, Hallar un valor de abscisa que acumula una probabilidad 
del 0.05; es decir, 


Р(Х < М) =0.05 


La tabla no proporciona un valor de abscisa para esta probabilidad acumulada 
de 0.05 
De acuerdo a la notación se tiene que М = Коз. 


Por matemática se tiene que: 
pe > En =0.05 
Х М 


Por el teorema-2 
1 

— =Y ~ F(5,3)gl 
(5,3)2 


РҮ > у=1—-Р(У < 1)=0.05 —> PY < ^—)=0.95 
М М M 


de la tabla, una probabilidad acumulada de 0.95 con 5 y 3 grados de libertad le 


corresponde una valor de abscisa igual a: /о05,53) = М: luego se tiene que: 
Езу 1 >M= : > Қозат 1 = 1 =0.11095 

м Fo95:5,3) Еоовзау) 9:01346 
ТЕОКЕМА-4 


Sea 7 una variable aleatoria con distribución normal estándar, se extraen todas 
las posibles muestras aleatoria de tamaño “п”, si para cada muestra elevamos 
al cuadrado cada valor y luego lo sumamos; la suma representada por X es 
una nueva variable aleatoria cuya distribución es Chi-Cuadrado con “n” grados 
de libertad; es decir; 


X= Xz g X mel 
i=l 
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El concepto de grados de libertad, corresponde a la suma de los cuadrados de 
variables independientes extraída de una distribución normal estándar. 


NOTA 
1 
Si п=1эХ=) Z =Z =Z ~ Loy 


i=l 


TEOREMA-5 


Sea X una variable aleatoria con distribución normal con media /4 y varianza 


“дз 


2 
O , se extraen todas las posibles muestras aleatorias de tamaño “п”, y se 
š 2 н А 8004 
calculan las varianzas muestrales 5 ; Іа variable aleatoria definida por: 


(п-)8%-, 
Ү- ) "Жа-ігі 
С 


Se distribuye соп una Chi-Cuadrado соп (и – 1)е/. 
TEOREMA-6 


Sea X una variable aleatoria con distribución normal con media /4 y varianza 


“дз 


2 
O , se extraen todas las posibles muestras aleatorias de tamaño “п”, y ве 
calculan sus promedios; la variable aleatoria definida por: 


X-u Z n(X - uy 


с с 


=Z" ~ Xog 


Үл 
Se distribuye con una Chi-Cuadrado con (1) gl 
TEOREMA-7 


Sea X una variable aleatoria con distribución normal con media Ё y varianza 


о? , se extraen todas las posibles muestras aleatorias de tamaño “п”, la suma 
de variables estandarizadas elevadas al cuadrado se distribuye con una Chi- 
Cuadrado con “п” grados de libertad; es decir, 


Ү= Л =) ES a 
ігі ігі с 
Se distribuye con una Chi-Cuadrado con (л) е7. 


TEOREMA - 8 


Sea X una variable aleatoria con distribución normal con media /4 y Varianza 


o?, y sea la siguiente identidad: 
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NO =D -D+G-wY 


У-У +) 


і-і і-і 


Dividiendo ambos miembros por la varianza, se tiene: 


(х, өзг и) (х, = xy тр 
2 > а-а» 
2 2 2 
с с с 


п da 
26 u) (п=1)82 nG- ш)? 
2 = 2 t 2 
с Ca с 


Por los teoremas anteriores se tiene: 


Жы Xa- Del + Жа 


Por lo tanto, para variables aleatorias independientes con distribución Chi- 
Cuadrado los grados de libertad son aditivos. 


EN GENERAL: 


Sean У,У,....У,, variables aleatorias independientes, con distribución Chi- 


Cuadrado con k,,k,,...,k,,, grados de libertad respectivamente, la nueva variable 


aleatoria definida por: 


m 


2 
Ент О зу ИРЕ 
i=] 


m 
Ejemplo 


Los tiempos en ser atendidos los clientes al realizar una transacción bancaria, 
se distribuye normalmente con media 2.5 minutos y desviación estándar 0.425 
minutos, se extrae una muestra aleatoria de 25 clientes y se registran los 
tiempos en ser atendidos. Hallar la probabilidad de que la varianza muestral del 
los tiempos de atención supere a un valor de “M” con probabilidad igual a 0.95: 


P(S? > М) = 0.95 


Мне) =0.95 


PS%>M)= Ae Ds? > 01M 
о? 


Por teorema-3, se tiene: 
(п —1)$° 
Y = E Б Xaia 


Luego: 


(п- A 


P(S*>M)=P(Y > 


(ПМ 1 py ¿DM 
а? 


MA) =0.95 


71 


De la tabla Chi-Cuadrado para 24 gl y una probabilidad acumulada de 0.95, le 
corresponde un valor de abscisa de 36.4150, luego: 


(25-1)M 


=36.4150 > 2 7 36.4150 > М = 0.27406 


(п —1)М. 
о? 


TEOREMA-9 


Sea X una variable aleatoria con distribución normal con media /4 y varianza 


2 
O , se extraen todas las posibles muestras aleatorias de tamaño “n” y se 
calculan las medias y las varianzas muestrales, las variables aleatorias Z y 
W, definidas por: 


Z= MX) ~ №03) 
с 


Е (п=10)52 , 


W a Жа-шй 


Por el teorema-1, de la distribución t-Student se tiene que: 


Z__ MA) 


ya- 
W 5 
n-1 


ш і-ші 


Ejemplo: 

Los montos diarios por ventas para un grifo que expende combustible para 
vehículos motorizados, se distribuyen normalmente con media 20,000 nuevos 
soles. Se elige una muestra aleatoria de 21 días de venta., obteniéndose una 


desviación estándar de 2,000 nuevos soles. ¿Cuál es la probabilidad de que la 
media muestral sea superior a una cantidad “М” con probabilidad 0.95? 


2 
X = Montos por ventas diarios ~ М (20,000; O” ) 
P(x > М)-0.95 


Р(х>Му)-Р( т(х-ш)> п(М-ш))-0.95 


Por teorema 


у"-и) 
S 

т(М-ш) 
5 


ma ata 


Р(Ү > y=1-Pr< MM) 095 
S 
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PY < MA, = 0.05 
4 


Para una probabilidad acumulada de 0.05 y 20 gl, le corresponde un valor de 
abscisa igual a: 
т(М-ш) -21((М-20,000) | 


1.72472 + М -19,247.27 
8 2,000 


ТЕОКЕМА-10 


Sean dos variables aleatorias Х e Y ambas independientes con distribuciones 
Я + 2 2 А 
Normales, con medias ш y 4, y varianzas о, у ©, respectivamente, 
de cada distribución se extraen todas las posibles muestras aleatorias de 
da А # 2 2 
tamaño п, у n,, у se obtienen las varianzas muestrales Sf у $», 
luego las variables aleatorias definidas por: 


2 
V= (л, -DS; ел 2 
с? (т =1)21 
(п, –1)82 _ > 
W = E "Жа,-гі 


Рог el Teorema 3, ве tiene: 


y 
1. 2 2 
G= k 2 Si E 2. 
=> => 2-7. 2 (1 -L:in—D el 
wW 2 6 
k, 


5.14. Ejercicios propuestos 


Los montos por ventas diarios de un grifo que se dedica a la venta de 
combustible, se distribuyen normalmente con media S/.26,000 y desviación 
estándar S/.3,900. Se elige un monto por venta en forma aleatoria para un día 
cualquiera. Hallar: 


1. ¿Cuál es la probabilidad de que el monto por venta supere los 5/.27,000?. 

2. ¿Cuál es la probabilidad de que el monto por venta se encuentre entre 
S/.25,500 y S/.26,5007. 

3. ¿Cuál debe ser el mínimo monto por venta, para que un monto por venta 
en un día cualquiera este considerado dentro del 5% de los mayores 
montos por ventas?. 

4. Sí se elige en forma aleatoria 5 montos por ventas. ¿Cuál es la 
probabilidad de que З montos por ventas superen los 5/.26,500? 

5. Calcular el valor de “М” 

Р(Х >2M)=0.95 
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10. 


11. 


12. 


Suponiendo que el monto por venta elegido se superior a los S/24,500, 
¿Cuál es la probabilidad de que no exceda los 5/.28,000? 

Si la tienda comercial tiene una venta inferior a los S/.23,000, a gerencia 
toma la decisión de cambiar la estrategia de ventas, ¿Cuál es la 
probabilidad de no cambiar la estrategia de ventas? 


X- 
Sea Хав) , calcular: 


a. P(X>10.117) 
b. Р(Х <22.760/ X > 9.39) 
с. P(8.231< X < 25.989) 


De la pregunta anterior Hallar el valor de “М” еп: 


P(12.857 < X < M) =0.75 


Xa~t 


Sea, (30) gl 
Calcular: 


Р(Х > 2.042) 

Р(Х < 2.042 /X >-2.457) 
Р(—0.53 < X < 2.457) 
Р(Х|<1.31) 

Р(Х >131) 

Р(Х <-2.457 LU X > 0.53) 


De la pregunta anterior Hallar el valor de “М” 


P(=1310< X<M)=0.85 


Sea, X ~ Бава 


En los siguientes casos calcular el valor ае “М” 
Р(Х > M)=0.95 
Р(Х <M)=0.01 
P(X < М) = 0.05 
Р(Х < М) = 0.99 


Р(Х > 2м) = 0.95 
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13. 


14. 


15. 


16. 


17. 


18. 


Los pesos de los varones adultos de una comunidad se distribuyen 
normalmente con media 68.5 Kg. y desviación estándar 8,22 kg.. Se elige 
a un varón adulto a azar. Calcular las siguientes probabilidades: 


Qué su peso sea superior a los 65.5 Kg. 

¿Cuál debe ser el mínimo peso, para que un varón adulto este 

considerado entre el 5% de los que tienen mayores pesos?. 

с. Supongamos que se elige a un varón adulto y su peso es superior a 
los 50.5 kg. ¿Cuál es la probabilidad de que su peso no supere a los 
70 kg?. 

d. ¿Cuál debe ser el tamaño de la muestra para que la media muestral 
supere los 65..0 kg. con probabilidad 5%. 

e. Síse elige a tres varones adultos. ¿Cuál es la probabilidad de que 2 

de ellos tengan un peso superior a los 66.0 Kg?. 


ош 


Sea una variable aleatoria con distribución normal estándar. Hallar las 

siguientes probabilidades: 

a. Зі se elige un valor de la variable, cual es la probabilidad de que sea 
superior a 1.28. 

b. Зі se elige un solo valor de la variable. ¿Cuál es la probabilidad del 
que el cuadrado de su valor sea superior a los 3.8417. 

с. Si se toma una muestra aleatoria de 15 valores. ¿Cuál es la 
probabilidad de que su promedio sea superior a 1.42? 

а. De la pregunta (с). ¿Cuál es la probabilidad de que la suma de los 
cuadrado de los 15 valores sea superior а 19.3107?. 

e. Dela pregunta (с). ¿Cuál es la probabilidad de que el cuadrado de la 
suma de los 15 valores sea superior a 61.875?. 


Sea X una variable aleatoria con distribución Chi-cuadrado con 20 grados 
de libertad, se toma una muestra aleatoria de tamaño 50. ¿Cuál es la 
probabilidad de que la media muestra sea superior a 24? 


Sea una variable aleatoria con distribución T-Student con 15 grados de 

libertad, se elige un solo valor de la variable. Calcular las siguientes 

probabilidades. 

a. Que el valor elegido sea superior a 1.75305 

b. Que el valor elegido se encuentre entre -0.86625 у 2.13145. 

с. Supongamos que el valor elegido es superior a -0.86625, ¿Cuál es 
la probabilidad de que no sobre pase el valor de 1.753057?. 


Sea X ~ Fog · Calcular el valor de “M” en todos los casos: 
Р(Х < М) =0.99 
Р(Х > М) =0.95 


Р(Х>М)-0.99 
РС. >М)-0.99 


о ш 


Una variable aleatoria cuya distribución es normal tiene por media 7; se 
extrae una muestra al azar de tamaño 15, y se obtiene por varianza 
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19. 


20. 


21. 


22. 


23. 


24. 


25. 


0.828: ¿Cual es la probabilidad de que la media muestral sea superior a 
7.41374. 


Sen X е Y dos variables aleatorias independientes соп 
2 2 д 
б,-І2 y с,=15; se extraen muestras al azar de tamaño 


П,-8 п, =12 respectivamente. Calcular el valor de “М” еп los 
siguientes casos: 


P(S? > M)=0.9 
Р(52 < М) =0.95 


b. 
2 1 
Pe > М2)= 0.95 
с. y 
S a2 
PEL >= М)= 0.99 
d. са 


Suponiendo que la longitud de los peces de cierta especie, tienen una 
distribución normal con una longitud promedio de 12 cm, y una varianza 


2 
de 3.24 CM се extrae una muestra al azar de tamaño 20. Hallar las 
siguientes probabilidades: 


2 
a. Que la varianza muestral sea superior а 3.6992 С”, 


2 
b. Qué la varianza muestral se encuentre entre 1.725 y 5.140? CM | 


Los montos por ventas diarios de un grifos que expende combustible, se 
distribuyen normalmente con media 5/. 20,000 y desviación estándar 
S/.2,000 . Se extrae una muestra al azar de 30 montos por venta diarios, 
Hallar el valor de “M” en las siguientes relaciones: 


a P(S? > М) = 0.90 
P(S? > 2м) = 0.98 
b. 3 


Los montos por utilidades mensuales de una empresa se distribuyen 
normalmente con media igual a 4,000 y desviación estándar igual a 420, 
se extrae una muestra de tamaño 100 montos por utilidades mensuales. 
¿Cuál es la probabilidad de que el monto por utilidad promedio supere los 
3,5007. 


Sea X _1(12)gl , Hallar el valor de "a" en: 
Р( X? >а )=0.95 


Ѕеа X~ (0, 1), se extraen una muestra aleatoria de tamaño 40, 
calcular el valor de "M" en: 


Р(Х” > М) =0.05 


Sean dos variables aleatorias independientes X е Y, ambas соп 
distribuciones Chi- Cuadrados tales; tales como: 
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26. 


27. 


28. 


29. 


30. 


31. 


X ~ x° (20)gl Y~ y’ (25)Jgl . Se extraen muestras 


aleatorias de tamaño 64 y 100 de cada distribución. ¿Cuál es la 
probabilidad de que la media muestral de la distribución Y sea superior 
a la media muestral de la distribución X en más de 3 unidades: 


Usando la información de la pregunta anterior calcular el valor de "M" en 
cada caso: 


a. P(X+Y>.M)=0.025 


b. РСУ-<Му-0.05 
2Х 
с. РОЇ 5 М)-0.05 
X 
а PÊŽ >M) =0.95 
2Y 


PŽ <; M)=0.01 
5Y 


Las pesos de los pobladores adultos de una comunidad tiene una media 
de 60.5 Kg. y una desviación estándar de 7.26 Kg., se toma una muestra 
aleatoria de 100 personas. ¿Cuál es la probabilidad de que el peso 
promedio se encuentre entre 54.5 Kg y 65.5 kg?. 


De la pregunta (27). ¿Cuál es mínimo peso para que un poblador adulto 
se encuentre considerado dentro del 5% de pobladores adultos con 
mayores pesos?. 


Sea X una variable aleatoria que tienen una distribución Chi-Cuadrado 


4 q» 


con 10 grados de libertad, Hallar el valor de “a” y “b”, de la ecuación: 
Р(а < X <b) = 0.93 Р(Х > Ь) = 0.05 


Rpta: а = 3.059 b = 18.307 


Sea X una variable aleatoria con media “0” y varianza la unidad, se extrae 
una muestra aleatoria de tamaño 20, Hallar el valor de “b * en: 


a P(=b<X<b)=0.95  b=0.438269 
b. Р(>Ь-0.908  b=0.00005 


Sea X una variable que tiene una distribución normal con media 200 y 
varianza igual a 25, se extrae una muestra aleatoria de tamaño 16. Hallar 
las siguientes probabilidades: 


a. Quela varianza muestral sea superior а 32.185. 
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32. 


33. 


34. 


35. 


b. Que la varianza muestral se encuentre entre 12.102 y 41.66 


16 
PO” (х, – 200)” < 800) 
i=l 
с РО – 200)? >16) 
Sea X una variable aleatoria que tiene una distribución normal con media 
20 y varianza 5, se extrae una muestra aleatoria de tamaño 30. Hallar el 
valor de “М” en: 


pom < 2 


<М)= 0.95 


Siendo “5” la desviación estándar muestral 
Rpta: М = 0.3734 


Sea X una variable aleatoria continua que corresponde al peso(Kg.) de un 
recién nacido de la maternidad de Lima, que tiene por función de 
densidad: 


ТЕЕ 
ЈО) =46 12 
0 para otros valores 
a. Se elige al azar a un recién nacido. ¿Cuál es la probabilidad de que 
su peso sea superior a los 2.0 Kg?. 
b. Se elige una muestra aleatoria de 60 recién nacidos. ¿Cuál es la 
probabilidad de que su peso promedio sea superior a los 2.5 Kg.? 
с. Se eligen a 5 recién nacidos al azar. ¿Cuál es la probabilidad de 
que por lo menos uno de ellos sea superior a 1.0 Kg?. 


0<х<3 


Rpta.:0.99987 


Las estaturas de los Cadetes de la EO-PNP tienen una distribución 
aproximadamente normal, con media 1.69 mts, y desviación estándar 
0.18 mts. Se elige a un cadete al azar: 


a. ¿Cuál es la probabilidad de que su estatura no sea inferior a 1.70 
mts. 

b. ¿Cuál es la probabilidad de que su estatura se encuentre entre 1.65 
y 1.70 mts? 

c. ¿Cuál debe ser la estatura mínima, para que el cadete se 
encuentre considerado dentro del 20% de los que tienen estaturas 
mayores?. 


De la pregunta (34) si se toma una muestra al azar de 50 cadetes. ¿Cuál 
es la probabilidad de que la estatura promedio del cadete se encuentre 
entre 1.65 mts y 1.70 mts, 
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36. Sea X una variable aleatoria con distribución normal estándar, se extrae 
una muestra aleatoria de tamaño 20, Hallar el valor de “b” en las 
siguientes ecuaciones: 


Р(—Ь < х < Ь) = 0.95 
Р(х” >b)=0.95 


а. 
b. 


37. Sean dos variables aleatorias independientes, ambas con distribución 
normal, tales como: 


X~ N (u ,4) 
Y ~ М(и, ,8) 


De ambas distribuciones se extraen muestra aleatorias de tamaño 6 y 9 
respectivamente. Hallar el valor de “М”, en la siguiente ecuación: 


52 
PEE <M)=0.01 


; %2 52 ; 
Dónde: ә, y , las varianzas de las muestras. 
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CAPITULO 6 


6.1. Distribuciones muestrales 


Son distribuciones que se forman con todas las posibles muestras elegidas al 
azar de tamaño n de una poblacion de tamaño N , con media poblacional 
и y varianza poblacional с? y su estadístico de interés. Las distribuciones 
muestrales más utilizadas en la inferencia estadística son: 


1. La distribución de la media aritmética muestral 
2. La distribución de la proporción muestral 
3. La distribución de la varianza muestral 


6.2. Distribución de la media aritmética_muestral (х) 


Теогета 


Sea X una variable aleatoria cuantitativa, definida en una población de 
2 


tamaño "N", con media poblacional y у varianza poblacional о: dada 
por: 


paz (1) 


о к ш)? 


с? = 
N 


(2) 


Se extraen todas las posibles muestras aleatorias de tamaño "n" de la 


población de tamaño "N", y se calculan las medias aritméticas muestrales Y 
para cada caso, entonces la media y varianza de las medias muestrales 


denotada por Ш y о: respectivamente, dependiendo del tipo de muestreo 
es igual a: 


CUADRO № 02 


Tipos de Media de la medias Varianza de la 
muestreo aritméticas medias 
aritméticas 
Con reemplazo  E(x)= uy = о? 
о población (5) MEA o; ir 
infinita 
Sin reemplazo, | E(x) = 44; = ш 2 o? N-n 
poblacion finita Ox P N ү) 
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Teorema 


Para una población de tamaño М, si la variable X tiene una distribución 
А А А ; 2 ; 
normal con media poblacional /{ y varianza poblacional O , la variable 


aleatoria X (media muestral) obtenida con o sin reemplazo, se distribuye 
también normalmente con media y varianza dadas por el cuadro 02 
respectivamente; es decir: 


х-М(ш-;62) 


6.3. Teorema central del límite 


Cuando la variable X, no tiene una distribución normal, pero su media y 
А 2 А . ~ 
varianza son Ш y O respectivamente, entonces a medida que el tamaño de 


muestra tiende a infinito (n —>› оо), la distribución de la medias muestral 


estandarizada, se aproxima cada vez más a una distribución normal estándar 
con media cero y varianza la unidad. En la práctica la aproximación es buena 
рага un tamaño de muestra n > 30. 


х-ш; 


РЯ 


— 2(01) para п-о 


Ejemplo-1: 
De una base de datos de 12,000 usuarios de un centro de información, se sabe 


> 2 
que la edad promedio es de 22 años y la varianza de 70 4NOS . Se extraen 
todas las posibles muestras sin reemplazo de tamaño 100. Hallar: 


1. La media de las medias muestrales. 
ш: = и = 22 años 
2. La varianza y desviación estándar de las medias muestrales. 


2 
о? (Мп; 70 12000-100, 0 694224518 
п М-1 100 12000-1 


La desviación estándar 
с; = ~ 0.694224518 = 0.833201367 


3. De la distribución anterior, se elige una muestra al azar. ¿Cuál es la 
probabilidad de que la edad promedio de un usuario sea superior a los 21 
años. 
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х-22 ы 21-22 
0.833201367 0.833201367 


Р(х > 21) = Р( у-Р(2>-120)-1-Р(2<-1.20) 


P(X >21) = P(Z >-120)-1-Р(7 < –1.20) =1- 0.1151 = 0.8849 


4. De la distribución anterior, se elige una muestra al azar. ¿Cuál es la 
probabilidad de que la edad promedio de un usuario se encuentre entre 


20 y 24 años. _ 
Р(20 < x < 24) = Р( а „ e 24=22 у= Р(—2.4< Z < 2.4) 
0.833201367 0.833201367 0.833201367 


Р(20 < х< 24) = P(2.4<Z < 2.4) = 0.9918 – 0.0082 = 0.9836 

Ejemplo- 2 

Del ejemplo-1, se elige una muestra al azar con reemplazo. ¿Cuál es la 
probabilidad de que la edad promedio de un usuario se encuentre entre 20 y 24 


años. 


Por teorema se tiene que: 
L = и = 22 años 


La varianza y desviación estándar de las medias muestrales. 


La desviación estándar 


a. = 10.7 = 0.83666 


Р(20 < х < 24) = Р( 20—225 азаа. 24-22, 739 <7 < 2.39) 
0.83666 0.83666 0.83666 


Р(20 <х < 24) = Р(-2.39 < Z < 2.39) = 0.9916 – 0.0084 = 0.9832 


Ejemplo-3 


Sea X una variable aleatoria que representa los montos por ventas diarias 
(cientos de nuevos soles) de una tienda comercial, cuya función de densidad 
esta dada por: 


5 1 (ох+1) 6<х<12 
(х) = +114 


0 Otros casos 
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Se extrae una muestra aleatoria de 50 montos por ventas. ¿Cuál es la 
probabilidad de que el monto por venta promedio se encuentre entre 800 y 
1000 nuevos soles. 
Solución 
Se trata de una población infinita, con una distribución que no es normal 
Calcular el monto por venta promedio 
12 1 
E|X |= | x——(Qx+1l)dx = 9.31579 
l= [+ 0x+D 
Calcular la variabilidad de los montos por ventas 


рар т20х +1)dx =89.68421 


V[x]=E|x”]-(E[x]? =89.68421-(9.31579)” =2.90027 
Por el teorema Central del Límite, se tiene: 


8931579 . x-9.91579 ¿10-9.31579 
¡Pa p p 
50 50 50 


) = Р(—5.46 < Z < 2.84) = 0.9977 


6.4. Distribución de la proporción muestral (Р) 


Sea X una variable, definida en una población de tamaño “М” соп dos 
categorías. La proporción o media de elementos con una categoría de interés, 


жоу. 4 ҚҰЖ 2 
en la población es 4, = р у la varianza de la proporción es С, = p(l- p) 
siendo р, la proporción de elementos con la categoría de interés еп la 


población. Se extraen de la población en estudio todas las posibles muestras 


aleatorias de tamaño "л" y se calculan la proporciones muestrales de interés 


para cada caso. La variable aleatoria definida por 
„ x п ае еіетепіоѕ con la característica de int erés | | 
p=== , tiene por media y 
п п 
varianza de las medias de las proporciones muestrales: 


TABLA N? 01 
Tipos de Media de la medias Varianza de la medias de la 
muestreo de la proporción proporción 
Con reemplazo | F(p) = Ay =P o К. Е р-р) 
Р n п 
Sin reemplazo мүч = 2 
р Е(р)-и,-р азы NE рй-р)(М-п, 
P n N-1 n N-I 
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De la distribución binomial se tiene: 


Р(Х = х) = Ср" para X=0,1,2,3,...1 


La función de probabilidad рага р=*, siendo х = пр, entonces la 
п 


distribución de la proporción muestral para muestras con reemplazo: 
л __ х øn „nÈ „п-пр _ 


En la distribución hipergeométrica se tiene: 


М-М, 
_ С, са X =0,1,2,3,...n 


n 


Р(Х = х) 


La función de probabilidad para p=Ž, siendo х= пр entonces la 
n 


distribución de la proporción muestral para muestras sin reemplazo: 


A X п п-пр 1 2 
Р(р= =) = 1" р=0,—,—,..1 (2) 
п пп 


6.5. Aproximación de la distribución normal а la distribución de Іа proporción 
muestral 


La verdadera probabilidad sobre un evento para una proporción muestral solo 
se determina mediante la distribución definida por (1 o 2). En situaciones 
cuando el tamaño de la población así como de la muestra es grande, los 
cálculos para obtener probabilidades de eventos de interés son laboriosos. 
Utilizando el teorema central del límite, se cumple que la variable aleatoria 


Р Е Hp 

Op 
Se aproxima a una distribución normal estándar, cuando л о, en 
situaciones prácticas, la aproximación es buena para un tamaño de muestra 
n >30. Experimentalmente la aproximación a la distribución normal es buena, 
si tanto лр o пф son mayor o igual a 5. Además cuando р es próximo а 0 о 1 


se debe tomar un tamaño de muestra mayor. 


Como la aproximación para calcular probabilidades de eventos, se realiza con 

una distribución continua, entonces para lograr precisión a los posibles valores 

de la proporción muestral 2, se le debe sumar o restar el factor de corrección 
n 


por continuidad | ., según sea el caso: 
2n 


Caso-1 
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і 


Р(р > а), supongamos que el valor “a” es un valor de Ê , ев decir а = —, 
n 


entonces la probabilidad pedida se puede calcular de la siguiente forma: 


Ж, Д 
P( > а) = P(z > 1-28 ) 
Р(ф > ау= P> 2") 
МЕ ЕЕ? 
PÈ <a) z P< 12") 
x 1 


PÈ <a) = P< #2) 


Caso-2 
Р(р > а), supongamos que el valor “а” по es un valor de Ê , pero que se 


х, х, 
4 +1 * А 
ubica entre los valores — у —= entonces la probabilidad pedida se puede 
n n 


calcular de la siguiente forma: 


А a O эп 4 

P(p>a)=P(p>a)=P(2> MU 2.2 ) =P(z > n ) 

? ? 
Obteniéndose en ambos casos el mismo resultado: 
Para: 
P(p<a) 

і 1 іні 1 
а сас а он 7% 

Р(Р <а) = Р(р < а) = Р(2 < )- Р(2 < ) 

Op б, 


Obteniéndose en ambos casos el mismo resultado: 


Ejemplo-1 


En una población de 3000 revistas científicas, se sabe que el 40% están 
escritas en idioma inglés, se elige una muestra aleatoria de 100 revistas. Hallar 
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la probabilidad de que la proporción muestral de revistas escritas en ingles sea 
superior a 0.44. 


Supongamos que la muestra es con reemplazo 


p=0.44=% > х =100(0.44) = 44 
n 
0.44 es un valor de Ё 


Usando su verdadera función de probabilidad calculamos para x mayor a 44 


44 
Р(х > 44) =1— Р(Х < 44) =1- X` C1” .0.4* (1-0.4) –1-0.821098367=0.1789 


x=0 


Ahora usando la aproximación normal: 
4, =p=0.4 


о? _ р-р) _ 0.4(1-0.4) 0.0024 
п 100 


La desviación estándar 


O, = 0.0024 = 0.048989 


104 
20100) 


0.048989 


0.44+ 
Р(р > 0.44) = Р(Х > 


) = Р(2 > 0.92) =1- Р(Х < 0.92) 


Р(р > 0.44) = P(Z > 0.92) = 1- P(Z < 0.92) = 1– 0.8212 = 0.1788 


Supongamos que la muestra es sin reemplazo 


р = 0.44 = ГЕТЕ 10000.44) = 44 
п 
0.44 es un valor ае Ё 
Usando su verdadera función de probabilidad calculamos para x mayor a 44 


44 (СІ29 71800 
Р(х>44)-1-Р(Х < 44) =1- Mx 


3000 
x=0 С; 00 


=0.17488258 


Ahora usando la aproximación normal: 


иь = р= 0.4 
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o? = PA-P) Nzn) 040-04) 3000-100 


{ ) = 0.002320773 
á n N-1 100 3000-1 


La desviación estándar 


с, = 10.002320773 = 0.048174408 


+ ТЕ чн 0.4 
20100) 


Р(р > 0.44) = P(Z > 
(Р ) ( 0.048174408 


) = Р(Х >0.93)-1-Р(2 < 0.93) 


Р(р > 0.44) = P(Z > 0.93) = 1- P(Z < 0.93) =1-0.8238 = 0.1762 


Nota: sin usar el factor de corrección por continuidad 


0.44- 0.4 
Р(р > 0.44) = P(Z > = Р(2 > 0.83) =1- Р(Х < 0.83 
Ф ) ( 01048174408, | ) ( ) 


Р(р > 0.44) = P(Z > 0.83) =1— Р(Х < 0.83) =1—0.7967 = 0.2033. 


Resultado que difiere significativamente del obtenido por la distribución 
hipergeométrica. 


Ejemplo-2 


Del ejemplo (1), hallar la probabilidad de que la proporción muestral de revistas 
escritas en idioma inglés sea mayor o igual a 0.44. Para un muestreo sin 
reemplazo. 


34 + - 
2(100) 
0.048174408 


0.4 
) = P(Z > 0.73) =1- Р(Х <0.73) 


Р(р > 0.44) = P(Z > 


Р(р 2 0.44) = P(Z > 0.73) =1- P(Z < 0.73) =1-0.7673 = 0.2327 


Usando la distribución Hipergeométrica (probabilidad verdadera), se tiene 
aproximadamente el mismo resultado. 

43 С!?% 1800 

Р(х > 44) =1- Р(Х < 44) =1 У x 10x 1] 0.767139 


3000 
x=0 Соо 


=0.232861 


Ejemplo-3 


Del ejemplo (1), hallar la probabilidad de que la proporción muestral de revistas 
escritas en inglés sea mayor o igual a 0.425. Para un muestreo sin reemplazo. 
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х = пр = 3000(0.425) = 42.5, luego 42.5 no es un valor de фр y la probabilidad 
se puede calcular de las siguientes formas: 


42.5 42 43 
Р(р > 0.425) = P(p > = Р(р> = Р(р> 
(Р )= Р(ф 100 )=P(P 100. (Р T 
42 1 43 1 
100 20100) ” g 100 2(100) | 
P(p > 0.425) = Plz > )=P(z2 
0.048174408 0.048174408 


Para la primera y segunda probabilidad: 
42 1 


ед 

100 2(100) 
0.048174408 

Р(р > 0.425) = P(z > 0.52) =1 – P(z < 0.52) =1 – 0.6985 = 0.3015 


Р(р 20.425) = P(z > 


)= Р( > 0.52) =1— P(z < 0.52) 


Para Іа primera y tercera probabilidad: 


43 1 


ард 
42.5 43 100 2(100) 

Р(р 2 0.425) = Р(р>2 5) = Р(р> = Р 

(Р ) (Р 100) (Р 100) G> 0.048174408 
BE н 
100 2(100) 


Р(р > 0.425) = P(z > ) = P(Z > 0.52) = 1- Р(Х < 0.52) = 0.3015 


0.048174408 
Ejemplo-4 


Del ejemplo (1), hallar la probabilidad de que la proporción muestral de revistas 
escritas en inglés sea igual a 0.48. Para un muestreo con reemplazo. 


P=0.48 = - — х =100(0.48) = 48 

0.48 es un valor de Р 

Usando su verdadera función de probabilidad calculamos para x igual a 48 
Р(х = 48) = С\® 0,4% (10.4) = 0.0214 


Ahora usando la aproximación normal: 
4, =p=0.4 


2 _ р-р) _0.4(1-0.4) 


о; - 0.0024 
в п 100 


La desviación estándar 
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O; = 0.0024 = 0.048989 


P(p = 0.48) = P( 


048-104 048+ 1 —- 
2(100) 2(100) 


< 
0.048989 0.048989 


04 


) = P(1.53 < 7 < 1.74) = 0.9591- 0.9370 = 0.0221 


6.6. Ejercicios propuestos. 


1. 


En una base de datos de 1000 revistas científica de una determinada 
especialidad, el 30% están escritas en idioma inglés, se extraen al azar 50 
revistas con reemplazo, Hallar las probabilidades. 


a. 


b. 


Qué la proporción muestral de revistas en idioma inglés, sea mayor 
a0.36 

¿Qué la proporción muestral de revistas en idioma inglés, sea mayor 
o igual a 0.36 

¿Qué la proporción muestral de revistas en idioma inglés, sea menor 
a 0.36 

¿Qué la proporción muestral de revistas en idioma inglés, sea menor 
o igual а 0.36 

¿Qué la proporción muestral de revistas en idioma inglés, se 
encuentre entre 0.3 y 0.36 

¿Qué la proporción muestral de revistas en idioma inglés, se 
encuentre entre 0.28 y 0.36 

¿Qué la proporción muestral de revistas en idioma inglés, sea igual 
0.36 

¿Qué la proporción muestral de revistas en idioma inglés, sea mayor 
a0.355 

¿Qué la proporción muestral de revistas en idioma inglés, sea menor 
а 0.335 


De una base de datos conformada por 10,000 libros , el 30% son de 
ciencias biológicas, se elige al azar 350 libros sin reemplazo, Hallar las 
probabilidades: 


a. 


b. 


с. 


а. 


¿Qué la proporción muestral de libros en ciencias biológicas, sea 
mayor a 0.28 

¿Qué la proporción muestral de libros en ciencias biológicas, sea 
mayor o igual a 0.28 

¿Qué la proporción muestral de libros en ciencias biológicas, sea 
menor а 0.28 

¿Qué la proporción muestral de libros еп ciencias biológicas, sea 
menor о igual а 0.28 

¿Qué la proporción muestral de libros en ciencias biológicas, se 
encuentre entre 0.28 y 0.4 

¿Qué la proporción muestral de libros en ciencias biológicas, sea el 
0.28 

¿Qué la proporción muestral de libros en ciencias biológicas, sea 
mayor a 0.29 

¿Qué la proporción muestral de libros en ciencias biológicas, sea 
menor a 0.29 


91 


3. Еп un centro de información conformado por 5000 usuarios, se sabe el 
35% son damas, se toma una muestra al azar de 325 usuarios sin 
reemplazo. Hallar las probabilidades: 


¿Qué la proporción muestral de usuarias sea mayor a 0.3? 

¿Qué la proporción muestral de usuarias sea mayor o igual a 0.3? 
¿Qué la proporción muestral de usuarias sea menor a 0.3? 

¿Qué la proporción muestral de usuarias sea menor o igual a 0.3? 
¿Qué la proporción muestral de usuarias se encuentre entre 0.3 y 
0.5.2. 

¿Qué la proporción muestral de usuarias sea mayor а 0.35? 

¿Qué la proporción muestral de usuarias sea menor а 0.35? 

¿Qué la proporción muestral de usuarias se encuentre entre 0.34 y 
0.37? 


papo 


so” 


6.7. La distribución de la varianza muestral 


Sea X una variable aleatoria con distribución normal con media Ё y varianza 
2 
O , se extraen todas las posibles muestras aleatorias de tamaño “п”, y se 
> 2 A В кын 
calculan las varianzas muestrales S”; la variable aleatoria definida рог: 


(п —1)5° 
Y= каржы. Xoia 


Se distribuye con una Chi-Cuadrado соп (n —1)gl . 
Ejemplo 


Sea X una variable que corresponde a los tiempos (minutos) que utilizan los 
clientes que realizan una transacción bancaria, cuya distribución es normal con 
desviación estándar es de 0.91 minutos. Se elige una muestra aleatoria de 41 
clientes. Calcular para cada caso el valor de M, en los siguientes casos: 


а. P(S’ >M)=0.1 
b. Р(5>М)-0.05 


Solución para (a) 


P(S? „му= PEDS © 2-0 (41-м, 
с O 


0.1 
(0.91)? 


)=P(Y > 


Donde: 

-1)5? 
pLEy Zarda 

с 
Luego: 
-DM ыу, 40M 01 y PY < ше 
(0.91) (0.91)? (0.91) 
De la tabla Chi-Cuadrado un valor tabular que acumule una probabilidad de 0.9 
para 40 grados de libertad, es 51.8051, luego se tiene: 


PY > 


)=0.9 
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40M 


=51.8051 М =1.0725 


(0.91) 


2 


Solución para (b) 


P(S>M)=P(S? > М?) =P( 


у-0.05 


(п-1)82 _ (n-1)M° 
2 > 2 
с с 


Dónde: 


Y 


-DS 


2 ~ Жаа! 
O 


Luego: 


P(Y > 


(41-1)M? 40M? 


2 у= PY > —)=0.05 > Pr 40М° = 0,95 
(0.91) (0.91)? (0.91) 


De la tabla Chi-Cuadrado, un valor tabular que acumule una probabilidad de 
0.95 para 40 grados de libertad, es 55.7585, luego se tiene: 


2 


DU 7 = 55.7585 > М =1.0744min utos 
(0.91) 
6.8. Ejercicios propuestos 


1. 


De una población de 12,000 usuarios de un centro de información, se 
tiene que la edad promedio es de 24.3 años y la varianza 13.27 años?, se 
extraen muestras aleatorias sin reemplazo de tamaño 80. Hallar el 
promedio y varianza de las medias muestrales. Además Hallar la 
probabilidad de que una media muestral de las edades elegida al azar 
sea superior a los 25 años. 


Una base de datos está compuesta de 300 revistas de computación, 200 
de física y 500 de matemáticas, se eligen al azar y con reemplazo 10 
revistas. ¿Cuál es la probabilidad de obtener por lo menos una de 
matemática? 


Las edades de los usuarios que concurren a centro de información se 
distribuye normalmente con media poblacional 25 años y varianza 
poblacional 56.25 años2, se elige al azar a un usuarios, calcular las 
siguiente probabilidades. 


a. Que su edad sea superior а 23 años 
b. Que su edad se encuentre entre 24 y 26 años 


De la pregunta anterior, supongamos que el tamaño de la población es de 
5000 estudiantes, se toma una muestra al azar y sin reemplazo de 
tamaño 50, calcular las siguientes probabilidades: 


a. Que la edad promedio sea superior а 24 años. 
b. Que la edad promedio se encuentre entre 23 y 27 años. 
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5. De una población de 5000 revistas científica en computación, se sabe 
que 3500 están en idioma inglés y 1500 en idioma español, se eligen al 
azar sin reemplazo 100 revistas científicas. Calcular: 


a. 
b. 
с. 


La media de las proporciones muestrales en idioma inglés. 

La varianza de las proporciones muestrales en idioma inglés. 

La desviación estándar de las proporciones muestrales en idioma 
inglés. 


6. De una base de datos de 12,000 usuarios de un centro de información, 


se sabe que la edad promedio es de 22.4 años y la varianza de 80 años” , 
Se extraen todas las posibles muestras sin reemplazo de tamaño 100. 


Hallar 

a. La media de las medias muestrales de las edades 

р. La varianza de las medias muestrales de las edades 

с. Рага una muestra cualquiera cual es la probabilidad de que la media 
muestral de las edades sea superior a los 23 años. 

а Рага una muestra cualquiera cual es la probabilidad de que la media 
muestral de las edades sea inferior a los 23 años. 

e. Рага una muestra cualquiera cual es la probabilidad de que la media 
muestral de las edades se encuentre entre 21 y 24 años. 

f. Para una muestra cualquiera cual es la probabilidad de que la media 


muestral de las edades difiera de la poblacional en 2 años. 


т. De una base de datos de 10,000 revistas científicas, se sabe que el 
promedio de artículos por revistas es de 8.2 artículos y su varianza de 


8.2369 articulos” Se extraen al azar y sin reemplazo 100 revistas. Hallar. 


a. 
b. 
с. 


La media de las medias muestrales de los artículos 

La varianza de las medias muestrales de los artículos 

Para una muestra cualquiera cual es la probabilidad de que la media 
muestral de los artículos sea superior a los 7 artículos. 

Para una muestra cualquiera cual es la probabilidad de que la media 
muestral de los artículos sea inferior a los 9 artículos. 

Para una muestra cualquiera cual es la probabilidad de que la media 
muestral de los artículos se encuentre entre 6 y 9 artículos. 

Para una muestra cualquiera cual es la probabilidad de que la media 
muestral de los artículos difiera de la poblacional en 2 artículos. 


6.9. Muestreo 


Es un procedimiento mediante el cual se extrae una muestra con о si 
reemplazo de una población, con el objetivo de obtener datos los cuales 
permiten estimar los parámetros de la población. El muestreo es utilizado en 
los proceso de toma de decisión en la vida diaria. 


Ejemplo: 


1. А través del muestreo se puede determinar con anticipación y con un 
margen de error que candidato obtendrá un cierto % de aceptación. 
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2. Estimar con un margen de error la cantidad promedio de usuarios que 
concurren a un centro de información. 

3. Estimar el total de artículos publicados por una determinada revista 
científica. 


6.10. Muestreo probabilístico 


Se realiza un muestreo probabilístico cuanto todas las unidades elementales de 
la población tienen igual o diferente probabilidad de ser elegido como parte de 


la muestra; es decir cada elemento de la población X; tiene probabilidad 


prefijada р;. 
Donde: 
1. р>0 


N 
ЖРА 
і-і 


3. Los р; no necesariamente son iguales. 


El muestreo probabilístico puede ser: 


a. Con reemplazo o reposición. 


Cuando una unidad elemental extraída o seleccionado de la población en 
estudios, se repone a la población antes de extraer el siguiente elemento. 


Ejemplo: 

Sean los elementos de la población, tal como: A, B, C, se extraen todas 
las posibles muestras con reemplazo de tamaño 2, las posibles muestras 
son: 

(АВ, AC, BC, ВА, СА, СВ, АА, BB,CC) 


р. Sin reemplazo o sin reposición. 


Cuando una unidad elemental extraída o seleccionado de la población en 
estudios, no se repone a la población. 


Sean los elementos de la población, tal como: A, B, C, se extraen 
muestras de tamaño n=2, las posibles muestra sin reemplazo son. 


{АВ, AC, BC) 


6.11. Muestreo simple aleatorio 


Es el método de muestreo que asigna igual probabilidad a cada uno de los 
elementos de la población estadística. 


Procedimiento 
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1. 


Se elabora el padrón de unidades de muestreo (marco muestral). 


Relación codificada de cada elemento de la población. 


Ejemplo 


Supongamos que se tiene una base de datos de 1000 revistas científicas. 
М = tamaño de la población (marco muestral) 1000 revistas científicas 


Códigos de las revistas № artículos Idiomas Cantidad de 
autores 
0001 6 Español 10 
0002 7 Inglés 12 
0003 4 Portugués 10 
1000 8 Inglés 14 


2. Supongamos que se desea elegir una muestra de 50 revistas 
n= tamaño de la muestra = 50 revistas científicas 


3. Utilizar la tabla de números aleatorios y seleccionar 50 números sin 
reemplazo. Como el tamaño de la población es de 1000 unidades, 
entonces de la primera columna de la tabla de números aleatorios se 
deben elegir los primeros 50 números significativos menores o iguales a 
1000. 


4. Seleccionar la muestra de acuerdo a los códigos seleccionados еп el 
paso 3. 
5. Ргосеѕаг la información. 


6.12. Muestreo estratificado 


Se usa cuando se conoce con anticipación de que la población esta dividida en 
estratos, que son equivalentes a categorías o clases. Los cuales por lo general 
no son de igual tamaño. Luego de cada estrato se extrae una muestra al azar 
(proporcional al tamaño del estrato, por asignación óptima y de Neyman). La 
combinación de muestras forma la muestra estratificada. 


6.13. Muestreo sistematico 


Se utiliza cuando los datos de la población en estudio están ordenados en 
forma numérica. Supongamos que la población es de tamaño 50, y 
deseamos extraer una muestra de tamaño 5, entonces se divide la población 
en 50/5=10 partes iguales, como la población se ha dividido en 5 grupos de 10 
unidades elementales, luego de la observación 1 a la 10 se elige un número al 
azar, supongamos que es el número elegido es el 7, luego este será el primer 
elemento de la muestra, y los siguiente elementos se obtiene sumándole 10; 
es decir: 7, 17, 27, 37, 47. 
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6.14. Determinación del tamaño de muestra para un muestreo simple aleatorio 
sin reemplazo 


Tamaño de muestra para estimar el promedio de una variable еп la poblacion 


¿Qué tamaño de muestra es necesario utilizar para estimar el promedio 
poblacional de una variable, con margen de error "d" у un nivel de confianza 


de (1— 2)100% 2. Tamaño de muestra que puede ser obtenido mediante la 
siguiente ecuación: 


P(x-p <d)=1-a 


"4" = margen de error еп unidades del promedio, permitido рог el investigador. 
" " . . . a 
1 — æ" =nivel de seguridad asumiendo muestreo repetido 


и 


Р(х-д<4)=1-а ЕЕ Aca а > Pas )=1-а 
o г 


б; х 


De la distribución normal estándar se tiene que: 


d í - 
IES E ы азық ы 
с- 1-5 i Ñ n N-I 
256: (29 
42-7? с? Na, Te d? d 
`n N-1 1 2? 1 
Па -І) 1+ 
= 7 ) wC 


Sea п, = E, entonces: 


Zo. 
©) п 
n= = Ш 
ZO.» -іІ 


(Ey -D 1+ 


La fórmula anterior se utiliza a se tiene información de la varianza de la 
población. 


Cuando la varianza de la población no se conoce, este valor se estima a través 
de una muestra piloto л * (usando para esto la tabla de los números aleatorios 
y luego se recopila los datos para calcular la varianza muestral y además se 
utiliza la distribución t-Student con los grados de libertad de la muestra piloto, 
en lugar Е | distribución Z) 


Sea л, ¿EA Sy, entonces: 


1*5,, 
а ) =, Mo 


ES z 
E =i 14% 


( 


97 


Nota: 
En todos los casos debe tomarse para “п” el entero mayor; es decir si el valor 
de “п” obtenido por la fórmula es igual a 16.3, entonces el tamaño de muestra 
es 17. 


Ejemplo 


¿Qué tamaño de muestra se requiere para estimar el promedio de acepciones 
por páginas en un diccionario compuesto de 1,800 páginas, si se acepta un 
margen de error de 2 acepciones por páginas con un nivel de confianza del 
95%. 

Procedimiento una muestra piloto de 30 páginas da como resultado las 
siguientes acepciones por páginas: 


62 45 50 63 48 
42 56 58 40 38 
56 55 50 45 61 
40 42 56 43 50 
49 47 56 39 51 
48 52 41 42 39 


Calculo de la media y varianza muestral de las acepciones por páginas. 


х =48.8 


30 


Уб, =x) 
ӛте —55.337931 


п - 
Too:0.005) =-2.04523 


2 *52 (-2.04523) *55.337931 


КЕЕ 7 = 57.869 
п, 57.869 Е 
J = = 56.0966 = 57 
и пу 1 57.869 —1 Páginas 
1+ 1+ 
N 1800 
Рага d =1 
2x2 E 2 4 
КИ ЧЕ ытын” 
а 1 
п, 231.4766 Е 
т Е = 205.2020 = 206 
" 14 n=l L4 231.4766 –1 páginas 
ON "1800 
Para d =3 


Pes? (-2.04523):%55.337931 


ШЕ; 32 = 25.7196 
по 25.7196 2 
= =25.3711=26 
р 14 -1 Т 25.7196-1 páginas 
ON “1800 
Para d=4 
2.22 Ж к 
,- = ЕН ( си 55.337931 _ 1 
My 14.4673 Шш 
Е Е = 14.3598 15 | 
" 14 n —1 13 14.4673 -1 páginas 
ON 1800 
Para а-5 
2% 2 Ж 2% 
4 Щас _ 2.04523) 55.337931 9 2590 
а 5 
По 9.2590 Е 
= = =9.2167=10 
í ny =1 9.2590 -1 páginas 
1+ 14 
N 1800 


Los resultados anteriores se resumen en la siguiente tabla 


n 


206 
57 
26 
15 
10 


6.15. Relación entre el margen de error y el tamaño de muestra (“ @ ” versus “ 
п? 
2 
Suponiendo fijos los valores de "т" Y S , se observa de la tabla anterior 


que existe una relación inversa entre el margen de error permitido por 
investigador y el tamaño de muestra encontrado; es decir a mayor margen de 
error, menor tamaño de muestra requerido y viceversa. 


олом 


d=f(M>osi d Toni 
Tamaño de muestra para estimar la proporción de una variable еп la 
poblacion 


¿Qué tamaño de muestra es necesario utilizar para estimar la proporción 
poblacional para una variable, con margen de error "4" у un nivel de 
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confianza de "(1 — а)100%"?. Tamaño de muestra que puede ser obtenido 
mediante la siguiente ecuación: 


Р(р-р|<4)-1-а 


"4" = margen de error permitido por el investigador. 
"1 — 2" =nivel de seguridad asumiendo muestreo repetido 


Pp- p|<d)=1-a > P( l-a >ғ(4<-4)-1 а 
Р б, 


De la distribución normal estándar se tiene que: 


Р-Р. 4, 
б, с 


а 2 с, N-n 
=Z ¿>d=Z0,>d*=Z%0,=Z*.2( ) 
б, E n N-I 
Z*0; 2б,, 
2 FE Ez ) 
d? =7? ”( )>n= Б >= 
Б 1 б, о, 
1+ 1 
l+ 7 ) w€ 7) ) 
Z 22(1- 
Sea п, = ( Ty Z pl P) entonces: 
d а” 
n 
n= 0 
пу—1 


Como el valor de Р, по se conoce este valor se estima a través de una 
muestra piloto п * (usando para esto la tabla de los números aleatorios y luego 


se recopila los datos para calcular Ê. 


Siendo n, 20» ) = 7°Р@- Р) 
а а 


Ejemplo 


¿Qué tamaño de muestra se requiere para estimar la proporción poblacional de 
revistas científicas escritas en inglés, de una población de 3000 revistas, si se 
acepta un margen de error de 5% у ип nivel de confianza del 95%. Si una 
muestra aleatoria piloto de tamaño 50 arroja que la proporción de revistas 
científicas escritas en inglés es 0.24? 


Datos: 


N=3000 

n = 50 
р = 0.24 
d = 0.05 


100 


200025) = -1.96 


0 


, _ EL96Y.0.24(1-0.24) 
Ме Сы СА E A E 


n= 


- 280.283136 
0.057 
т 280.283136 
= =256.41= 25 
8-1 |, 280283136-1 ‚ 
ON i 3000 


6.16. Ejercicios propuestos: 


1. 


¿Qué tamaño de muestra se debe elegir de una población 3,000 revistas 
científicas, si se desea estimar el promedio de artículos por revistas en la 
población, con un margen de error 2 artículos („+2) y un nivel de 
confianza del 95%?. Una muestra aleatoria piloto de 10 revistas arroja los 
siguientes artículos: 


15 5 13 10 8 4 9 11 7 13. 


¿Qué tamaño de muestra se debe elegir de una base de datos de 3,000 
usuarios registrados en un centro de información, si se desea estimar la 
edad promedio de los usuarios en la población, con un margen de error 3 
años (и+з) y un nivel de confianza del 95%?. Una muestra aleatoria 


piloto de 10 usuarios arroja las siguientes edades (años): 


22 36 18 42 25 30 25 29 40 23. 
¿Qué tamaño de muestra se debe elegir de un diccionario de 1,500 
páginas, si se desea estimar el promedio de acepciones por páginas en la 
población, con un margen de error 3 acepciones (u + 3) y un nivel de 


confianza del 90%?. Una muestra aleatoria piloto de 10 páginas arroja los 
siguientes números de acepciones por páginas: 


42 25 30 38 29 36 40 5 40 23. 


De una población 1300 revistas científicas, se desea estimar la proporción 
poblacional de revistas escritas en inglés, con un margen de error "d" y 
un nivel de confianza del 95%. Una muestra aleatoria piloto de 20 
revistas arroja que la proporción muestra de revistas escritas en inglés es 
de 0.55. Verificar para cada valor "а" su correspondiente tamaño de 
muestra "л", para la siguiente tabla: 


d n 
0.05 295 
0.07 169 
0.08 134 
0.09 108 
0.10 89 
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¿Qué tamaño de muestra se debe elegir de 2,000 libros existentes en un 
centro de información, si se desea estimar la proporción poblacional de 
libros en buen estado de conservación con un margen de error del 8%( la 
proporción muestral se encuentre entre P-8% y P+8%) y un nivel de 
confianza del 95%?. Si una muestra piloto de 20 libros elegidos al azar 
arroja los siguientes resultados en cuanto a su estado de conservación: 


bueno malo malo bueno bueno bueno 
malo malo bueno bueno bueno bueno 
bueno bueno malo malo malo malo 
bueno malo 


Que tamaño de muestra se debe elegir de una base de datos conformada 
рог 2,000 revistas científicas, si ѕе desea estimar la proporción 
poblacional de revistas escritas en inglés con un margen de error del 8% y 
un nivel de confianza del 95%. Si una muestra piloto de 20 revistas 
elegidas al azar arroja los siguientes resultados: 


Inglés Español Español Inglés Inglés Inglés 
Español Español Inglés Inglés Inglés Inglés 
Inglés Inglés Español Español Español Inglés 
Español Español 
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CAPITULO 7 


7.1. Inferencia estadística 


Es parte de la estadística que proporciona métodos y procedimientos para el 
análisis de datos, cuando estos por su naturaleza presentan incertidumbre en 
la toma de decisión, para el análisis de datos de una variable de interés en la 
poblacion en estudio, se toma una muestra al azar. La inferencia estadística se 
encarga de la estimación de parámetros (estimación puntual y por intervalo) y 
la prueba de hipótesis de los parámetros de interés en la población. 


7.2. Conceptos básicos: 


1. Población.- Es la totalidad de unidades elementales (personas, 
animales u objetos) que poseen una característica común. 

2. Мивевіға.- Es una parte de la población en estudio. 

3.  Variable.- Es una característica de interés en la unidad elemental. 

4 Parámetro.- Es un valor fijo que caracteriza a la variable en estudio. 
А un parámetro en general se le representa con el símbolo: 0, en 
nuestro caso puede representar а la media poblacional " 2 "oa la 


2 
Lu 


varianza poblacional " ст 

5.  Estimador о estadística.- Es una función definida con los elementos 
de la muestra aleatoria y que no contiene cantidades desconocidas. 
Un estimador es una variable aleatoria ya que su valor cambia de 
una muestra a otra muestra. A un estimador se del representa por el 
símbolo: 


Ô = F(X,,X>,...x,) 


Ejemplo: 
б = /(хх,„..х„) ==H—=x 
п 


7.3. Concepto de muestra aleatoria 


Sea f(x,0) una función de probabilidad y (X,,X,,..., Х„) una muestra 


de tamaño л, se dice que es una muestra aleatoria, si cumple dos 
condiciones: 


e Cada X, es independiente ¡=1,2....,n 


e La distribución de cada /(Х,,0)- /(х,0) son idénticamente 
distribuida, tienen la misma distribución de probabilidad. 


7.4. Estimación puntual de un parámetro 
Consiste en estimar con un solo valor al parámetro de la población, con 


los datos que le proporciona la muestra aleatoria y el estimador 
respectivo. 
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Ejemplos 


Una estimación puntual para la media poblacional Ш es la media 
muestral X 


+ Д: E А 2 А 
Una estimación puntual para la varianza poblacional с es la varianza 
muestral $°. 


Es decir: 
X> (Significa que la media muestral estima a la media poblacional) 


2 2 š АР P А : 
S” —> о (Significa que la varianza muestral estima а la varianza 
poblacional) 


Ejemplo: 1 


Con el objeto de obtener una estimación puntual del gasto promedio 
mensual de las familias del distrito de La Victoria, se toma una muestra 
aleatoria de 10 familias; siendo los gastos mensuales de las familias en 
nuevos soles: 


730 770 750 840 850 850 880 920 890 1100 


Una buena estimación puntual del gasto promedio mensual en el distrito 
de la victoria (población) es dada por la media aritmética muestral, es 
decir: 


10 


Y- 2% _ 730+ 770+ 750+ 840 + 850 + 850 + 880 + 920 + 890 +1100 
10 10 


= 5 /.858.00 


También una estimación puntual para la variabilidad de los gastos 
mensuales (varianza de la población) es: 


10 


У х2 -10х° А А | 7 
› £ _ 730? + 770° +...+1100? –10(850) 
10-1 9 


=11,130.25 


Supongamos que el distrito de la victoria está conformado por 150,000 
familias, estimar el gasto total mensual de las familias del distrito. 
Como 


X>pu también МХ-» Ми 
Siendo: 
Nu = Gasto total mensual de las familias 


МХ =Una estimación del gasto total de las familias 
NX =150.000*858=127'500,000. 


104 


7.5. Propiedades de un buen estimador puntual 


a.  Insesgado 


Un estimador 2 , se dice que es insesgado (sin sesgo), para е! 


parámetro 0 , Cuando la esperanza matemática del estimador es 
igual al parámetro; es decir: 


E(Ó)=0 


р. Consistencia 


Un estimador д , se dice que es consistente рага el parámetro 0. 
cuando para un tamaño de muestra muy grande, el valor de 
estimador se aproxima al parámetro, es decir: 


Lim(0,)=0 


С, Eficiencia 


Sean Ó, y 0, dos estimadores insesgado para el parámetro 0 ' 
se dice que Ó, es más eficiente que 0, , si se cumple que: 
V(0,)<V(0,) 
а.  Suficiencia 


Un estimador Ó se dice que es suficiente para el parámetro Ө ‚ Sİ 
utiliza toda la información que le proporciona la muestra aleatoria. 


7.6. Sesgo 


Se define como la diferencia entre el valor esperado del estimador y su 
respectivo parámetro, es decir: 


безео(б)- Е(0)-0 
El valor del sesgo puede ser negativo, positivo o cero. 


7.7. Métodos para obtener estimadores puntuales 


1. Método de mínimos cuadros ordinarios (MCO) 
2. Método de máxima verosimilitud (MV) 
3. Método de momentos (ММ) 
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7.8. Ejercicio propuesto 


a. Sea X ~ N(u;o”), se extrae una muestra aleatoria de tamaño “п”. ¿ Es 


Ў _ 
Y (x, -х) 2 

52-4 un estimador insesgado de О , de no ser así, calcular el 
n-1 


sesgo. 
Solución 


2 
Para que 87, sea un estimador insesgado de O, se debe cumplir que 


Ae 
2 2 „г ха 
Е(57) = с^, sesabe que а ааш сото (n=1)8? = У (х, х)? 


і-і 


(п-1)8: 
Y = =. ! ~ Хон > El 


(1-08, n-1>(n-DE(S*)=(n-Do? > E(8?*)=0? 


Luego la variancia muestral 57 es un estimador insesgado de la variancia 
poblacional с? . Luego el sesgo es cero. 


b. Sea X ~ N(u;o”), se extrae una muestra aleatoria de tamaño “n”. 2 Es 


Уо, 1) 


2 
52 = un estimador insesgado de O deno ser así, calcular el 


п 
sesgo. 


Solución 


2 
Para que S? , sea un estimador insesgado de О ,se debe cumplir que 


Ж - x)? 


25,20 2. o А a 
E(S*)=0”, sesabe que м сото nS? = У (х, - х)? 
nS? nS? -1 
ү= ya > ECH = 15 ES) =+ 0? 
с с п 


Luego el sesgo: 


2 А -1 
Sesgo(S?) = E(S?) -0° = 07-6 = 
п 
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7.9. Estimación de parámetros por intervalos de confianza 


Se estima al parámetro de la población 0 usando un intervalo de la forma 
a<0<b , siendo a у b el límite inferior y superior del intervalo 
respectivamente, límites que son calculados a través de un estimado para 
el parámetro y un nivel de confianza deseado, usualmente los niveles de 
confianza utilizados son: 90%, 95% o 99%. Es la confianza de que el 
intervalo contenga al parámetro de la poblacion. 


7.10. Intervalo de confianza para la media _ poblacional а cuando la varianza 


šj 2 4 
de la población О ев conocida. 


Sea X una variable aleatoria con distribución normal y varianza 


қ 2 А ы а 
poblacional O” conocida, se extraen de dicha población una muestra 
aleatoria de tamaño “п”, con el objetivo de obtener una estimación por 
intervalo de confianza para la media poblacional 4. 


ALNO:D>P(z, <Z<z ,)=1-0 
O; D (=) 


De Z= 


Reemplazando 2 por su valor. Se tiene: 


X-H 
a < <2 a) =1-4 , despejando el valor de џ, se tiene 


= с с 
Р(х-2 „.—=<и<х+2„.—=)=1—@,‚, ahora para una sola 
E n ©? п 
muestra en particular, ya no hablamos de iia: sino de la 
a a 6 : = = с 
confianza (1-а)100% de que el intervalo (х Zay т? 3x4 a a 


contenga al verdadero valor del parámetro H. 
Luego, un intervalo de confianza del (1-а)100% , para la media 
poblacional ш, ев dado por: 


Donde: 


1-а = Es la confianza de que el intervalo encierre o contenga а! 
verdadero valor del parámetro, su valor puede ser: 0.90, 0.95 o 0.99., 
para cuando a toma el valor 0.1, 0.05 o 0.01, respectivamente. 


а = Es la confianza de que el intervalo no contenga al verdadero valor 
del parámetro. 
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Ejemplo 2. 


Obtener una estimación por intervalo de confianza del 95% para el gasto 
promedio mensual de las familias del distrito de La Victoria con la información 
del ejemplo 1, suponiendo que los gastos de las familias tienen una distribución 
normal con desviación estándar de S/.106. 

Datos n=10 X=858 с=106 1-0 = 0.95 ә а = 0.05. Este último valor lo 
dividimos en dos partes 0.025 a Іа izquierda de la distribución normal estándar 
y 0.025 a la derecha de la distribución normal estándar, es decir área a la 
izquierda y derecha de la distribución normal estándar, luego los valores de 
abscisas para las áreas lo obtenemos de la tabla, correspondiendo a 
Zoos) ==1.96 y Zoss) =1.96, para la fórmula usamos cualquiera de ellos еп 


valor absoluto. 


Luego: 


Conf (858-1.96* Su <858+1.96* 10) = 0.95 


/о 
Conf(792.30< и <923.70)=0.95 


Interpretación: Existe una confianza del 95% de que el intervalo (792.30 ; 
923.70) contenga al verdadero gasto promedio mensual de las familias del 
distrito de La Victoria. Otra forma es también existe una confianza del 95% de 
que el gasto promedio en el distrito de la Victoria se encuentre entre (792.30 ; 
923.70) 


7.11. Intervalo de confianza para la media q de la población cuando la 


И 1. 2 А 
varianza de la población ©“ ез desconocida. 


Sea X una variable aleatoria con distribución normal, con media „ y 
varianza poblacional с> desconocida, se extrae de dicha población una 


“дз 


muestra aleatoria de tamaño “n”, con el objetivo de obtener una 
estimación por intervalo de confianza рага la media poblacional ш. Un 


intervalo de confianza del (1-а)100% , para la media poblacional 2, es 


dado por: 
Conf (х і S <u<x+t Е о para п<30 
? 0-5; п-1) КРА а n-1) Ап Р Е 
= $ = $ 
Conf (x-z , SUSX+Z, )-1-а para п>30 
4-5: п-1) ajn ©? п-І) ГІ 
Ejemplo 3. 


Supongamos que los datos del ejemplo 1 provienen de una población con 
distribución normal, construir e interpretar un intervalo de confianza del 
99% para el gasto promedio mensual de las familias del distrito de la 
Victoria. 
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Datos n=10, X=858, s=105.5, 1-а = 0.99 а = 0.01 Usamos 
este último valor dividido por 2 еп la distribución t -Student рага 9 
grados de libertad, y calculamos los valores de abscisa para un área igual 
a 0.025 a la izquierda y derecha y con 9 grados de libertad. т =2.821 


(0.025; 9) 


Сопу (858 —2.821*105-5 < u <858 +2.821* 1055). 0.99 
ЛО 0 


Ло 
Conf(763.89< ш <952.11)= 0.99 


Interpretación: Existe una confianza del 99% de que el intervalo (763.89 ; 
952.11) contenga al verdadero gasto promedio de las familias del distrito 
de La Victoria. 


2 
7.12. Intervalo de confianza рага la varianza de la población © 


Sea X una variable aleatoria con distribución normal, se extraen de dicha 


población una muestra aleatoria de tamaño “n”, con el objetivo de 
obtener una estimación por intervalo de confianza para la varianza 


poblacional o? . Un intervalo de confianza del (1—@)100% , para la 


n 5. 2 
varianza poblacional С”, es dado por: 


(п —1)5? 


Ae? 
ap < (9-08 


Conf ( )=1-а 


а 
ао? D 


Ejemplo 4 


Suponiendo normalidad en la distribución de los gastos de las familias del 
distrito de la victoria, construir e interpretar un intervalo de confianza del 90% 
para la varianza de los gastos de las familias del distrito de La Victoria con la 


información del ejemplo 1, 

Datos n=10 s=105.5 1-a=0.90>a=0.1 Usamos este último valor 
dividido por 2 en la distribución Chi-Cuadrado con 9 grados de libertad; y 
calculamos los valores de abscisa para un área igual a 0.05 a la izquierda y 
derecha де la distribución  Chi-Cuadrado, estos valores son: 
Хо) = 3.325 Хо) =16.919 


(10-1/105.5): жен (10-1)(105.5): 


С <o < 
mo —16.919 3.325 


= 0.90 


Conf (5,920.695567 < o° < 30,126.9925) = 0.90 
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Interpretación: Existe una confianza del 90% de que el intervalo (5,920.69 ; 
30,126.99) contenga a la verdadera variabilidad de los gastos de las familias 
del distrito de La Victoria. 


Para obtener un intervalo de confianza del 90% para la desviación estándar, 
se extrae la raíz cuadrada para cada uno de los términos. 


Conf (76.9460 < o <173.5713)- 0.90 
Interpretación: Existe una confianza del 90% de que el intervalo 


(76.9460;173.5713) contenga a la verdadera desviación estándar de los 
gastos de las familias del distrito de La Victoria. 


7.13. Intervalo de confianza para la razón de dos varianzas poblacionales para 
dos variables aleatorias independientes con distribución normal. 


Sea X e Y dos variables aleatorias independientes con distribución 

normal con media (44 01) para la primera variable y (4, 002) рага Іа 

segunda variable; de ambas se extraen muestras aleatorias de tamaño 

Пу y П, respectivamente; un intervalo de confianza del (1 —0)100%, 
2 


ý š g 1 
para la razón de varianzas poblacionales o , es dado por: 
2 


582 о} 82 
Conf (F кысы 22) = (1- 0)100% 
а 2 2 a 2 
Gail =D) 5; о; (mom =D) 5; 
Siendo: 
_ 1 
(2; п-1,п;-1) Ғ @ 
Е da n,-1,m-1) 


Interpretación: 


Existe una confianza del (1-а)100% de que el intervalo 

2 
Si S? A | сі 

а ға 7), contenga a la verdadera razón de varianzas —; . 

Gsa-L,61) 5; (4161) 5% о; 


Ejemplo 
Se desea comparar las varianzas de los tiempos de atención a los clientes de 


dos agencias bancarias, para esto se toma en forma aleatoria muestras de 
tamaño 20 y 25 para cada agencia bancaria, obteniéndose para la primera 
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muestra una varianza de 0.09 minutos? y para la segunda muestra una varianza 
de 0.1764 minutos’. Suponiendo que los tiempos de atención para ambas son 
normales e independientes; obtenga un intervalo de confianza del 90% para la 


2 


2 f б 
razón de varianza —. 
т, 


Сото: 
1-а=0.9 >а = 0.1 


De la formula: 


0 2 0.0 
сө, зе OO 
24) 0,1764 о, (119,24) 0,1764 
0.09 o? 0.09 
Conf (Е os. Еа БЕ ‚————)=90% 
f ( (0.05;19,24) 0.1764 с? (0.95,19,24) 01764) 0 
De la tabla 
F = l = | = = 0.4730 
к Fio.95,24,19) Fo95:24,19) 2.11414 | 
Fo9519,24) = 2.03986 
Por lo tanto: 
2 
Conf(0.4730. шы < 2 <2.03986. 2.03 )=90% 
0.1764 о, 0.1764 


2 
Conf (0.2413 < - <1.0407) =90% 


2 


Interpretación: 


Existe una confianza del 90% de que el intervalo (0.2413 ; 1.0407) contenga al 


verdadero valor de la razón de las varianzas poblacionales ©. 
б, 


7.14. Intervalo de confianza para una proporción poblacional 


Sea una población de tamaño N, con dos cualidades, y sea P la proporción 
de elementos con la cualidad de interés, se extraen todas las posibles 
muestras aleatoria de tamaño л, la variable aleatoria proporción muestral 


КР, ДЕ ы ; ; 
p==, siendo "x" el número de elementos еп la muestra aleatoria con la 
n 


cualitativa de interés, рага n о (n>30) convergencia asintótica, la variable 


aleatoria Z = 22? ~ М(0;1) 
g 
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Un intervalo de confianza del (1—@)100% , para la proporción Р de la 
población, es dado por 


cita la 
2 б, с) 


орен, a Op алты а. 
72) 2 


Dónde: 

1-а = Еѕ la confianza de que el intervalo encierre o contenga al verdadero 
valor de la proporción Р, su valor puede ser: 0.90, 0.95 o 0.99, para cuando а 
toma el valor 0.1, 0.05 o 0.01, respectivamente. 


а= Es la confianza de que el intervalo no contenga al verdadero valor del 
parámetro. 


2 pd-p А 
су = рер) Si el muestreo es con reemplazo 
п 
о? = BU=P) N =n Si el muestreo es sin reemplazo 
Р п N-1 
Ejemplo 


Una empresa produce artículos para el hogar. Una muestra de 70 artículos 
arroja que 8 son defectuosos. Hallar un intervalo de confianza del 95% para la 
proporción P de artículos defectuosos en la población. (Asumir muestreo con 
reemplazo) 


numero de defectuosos _ 8 


De los datos se tiene que P= = 0.11429 


tamaño de muestra 7 


=Z us = Zoss =1.96 о, = PD „ PEACE 09803 
D p n 70 


Conf (0.11429 — 1.96 * 0.03803 < P < 0.11429 + 1.96 * 0.03803) = 0.95 
Luego 
Conf (3.98% < P < 18.88%) = 95% 


Interpretación: 


Existe una confianza del 95% de que el intervalo (3.98%; 18.88%) contenga 
la verdadera proporción P de artículos defectuosos producidos por la empresa. 


7.15. Intervalo de confianza para la diferencia de dos medias poblacionales 
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Caso-1 


Cuando las dos varianza poblacionales с? у œ}, son conocidas 


Sean X e Y dos variables aleatorias independientes con distribución normal 
X —(д,; с!) y Y ~ (1, 6: de ambas poblaciones se extraen muestras 


aleatorias independientes de tamaño ІҢ у @ respectivamente; un intervalo 
de confianza del ((-J100% рага la diferencia de dos medias poblacionales 
44 — 4h, es dado por: 

2 2 2 2 


Conf (x-7 -z | | < д, l, Sx у+ „.|©'-+®) 1-а 


Саво-2 


Cuando las dos varianza poblacionales of у œ}, son desconocidas y 
homogéneas 


Sea X e Y dos variables aleatorias independientes con distribución normal 


X~ (д, о) у Y~ (1, seda de ambas poblaciones se extraen muestras 


aleatorias independientes de tamaño n y Ha respectivamente; un intervalo 
de confianza del ((-J100% рага la diferencia de dos medias poblacionales 


Ш-Н, es dado por: 


Соп/(х-ў-1 5, І <ш ш Sx y+t 


a $ a а 
(atm 2) п (7зт+т -2) п 


(п, Ds; +(п, —1)5; 
пү+п,—2 


Siendo: 52 = , la varianza ponderada 


Caso-3 


Cuando las dos varianza poblacionales с у с}, son desconocidas y 
heterogéneas 


Sea X e Y dos variables aleatorias independientes con distribución normal 
Х-(ш:69 y Y - (1,50%); de ambas poblaciones se extraen muestras 


‚оӊ z 2 п п ; a 
aleatorias independientes de tamaño 1 y 2 respectivamente; un intervalo 
de confianza del (1-%)100% рага la diferencia de dos medias poblacionales 


44 — 4h, es dado por: 


Conf (х Ft 2 < 44-4, <х-у+і 16) =1-а 


1-6 
(MG 
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п 


Siendo: k = ————————, los grados de libertad de la distribución t. 


7.16. Intervalo de confianza para la diferencia de dos proporciones 
poblacionales (4% —2%) 


Sean dos poblaciones de tamaño N, y М,, еп las cuales se definen dos 
proporciones de interés P, y P,, de cada una de ellas se extraen muestras 
aleatorias de tamaño n, у n, y para cada muestra se calcula р, y p,, para 
cuando: 

п уо y п,->9 (п 230 y n,>30), entonces: 


y Pb (AP) 


~ N(0;1) 


Pi-b2 


Un intervalo de confianza del (1—0)100% , para la diferencia de dos 
proporciones (Р – Р,) poblacionales es dado por: 


Conf (Р; Еа a T n-p Ś R-P, <(P, Ро) +2 ар-р) =1-а 
2 


Donde: 


1-а = Еѕ la confianza de que el intervalo encierre o contenga al verdadero 
valor de la diferencia de las proporciones poblacionales (р — P,), su valor puede 
ser: 0.90, 0.95 o 0.99, para cuando о toma el valor 0.1, 0.05 о 0.01, 
respectivamente. 


а= Es la confianza de que el intervalo no contenga al verdadero valor del 
parámetro. 


в? 0-8) 7 ÊA- Ê) 
n 


Si el muestreo es con reemplazo 


n 


1 2 


dE PIP N: тіз, POT BA М 2") іеі muestreo es sin reemplazo 
í п, N,-1) п, М,—1) 


7.17. Ejercicios propuestos 


1. Соп la finalidad de estimar el peso promedio de los frutos de la papa por 
planta, así como su variabilidad, se extrae una muestra aleatoria de 
tamaño 10, de un terreno de una hectárea compuesta por 500 plantas; y 
se registra el peso (K g) de sus frutos por planta, tal como se indica a 
continuación: 

2.8 36 30 40 35 40 38 35 36 3.0 
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a. Obtener una estimación puntual para el peso promedio de los frutos 
de la papa por planta, para la hectárea sembrada así como su 
varianza. 

b. Estimar la producción total de papa para la hectárea sembrada. 

с. Hallar un intervalo de confianza del 95% para el peso promedio de 
los frutos de la papa por planta, para la hectárea sembrada, si se 
sabe que por estudios pasados la varianza de la población es de 
0.176 kg2 

а. Hallar un intervalo de confianza del 95% para el peso total de la 
hectárea sembrada si se sabe que por estudios pasados la varianza 
de los frutos por planta es de 0.176 kg2. 

e. Hallar un intervalo de confianza del 95% para el peso promedio de 
los frutos de la papa por planta, para la hectárea sembrada. 

f. Hallar un intervalo de confianza del 95% para la varianza de los 
pesos de los frutos por planta, de la hectárea sembrada. 

g. Hallar un intervalo de confianza del 95% para la desviación estándar 
de los pesos de los frutos por planta, de la hectárea sembrada. 


2. El peso de los recién nacidos en la maternidad de Lima, se distribuyen 
normalmente; una muestra de tamaño 44 es extraída de la población. 


28 29 30 35 36 37 38 38 36 35 29 
29 25 35 34 31 31 35 36 37 29 28 
28 29 30 30 30 35 35 35 35 35 34 
35 35 38 36 36 34 29 28 28 25 30 


а. Estimar el peso promedio de la población de los recién nacidos, а 
través de un intervalo de confianza del 95 % . Interpretar 

b. Estimar la desviación estándar de la población a través de un 
intervalo de confianza del 95. Interpretar 

с. Supongamos que la varianza población es 0.3, estimar el peso 
promedio mediante un intervalo de confianza del 95% . Interpretar. 


3. La longitud de las mazorcas de dos variedades de maíz se distribuyen 
normal e independientemente; se extraen muestras aleatorias de tamaño 
12 y 10 respectivamente de cada variedad; obteniéndose por desviación 
estándar рага la primera variedad 2.25 cm y рага la segunda variedad 
una desviación estándar de 1.86 cm. Hallar un intervalo de confianza del 


Г 


Ж А r (92 
90%, para el verdadero valor para la razón de varianzas poblacionales =. 


2 


б; 
4. Las alturas de los alumnos de cierta universidad se distribuye normalmente, 
una muestra aleatoria de tamaño 20 es extraída, con la finalidad de obtener 
algunas estimaciones, obteniéndose por media 1.68 Mts y desviación 
estándar 0.2520 Mts. Hallar: 


a. Un intervalo de confianza del 95% para la verdadera estatura 
promedio de los alumnos de la universidad. 
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b. Un intervalo de confianza del 95% para la verdadera desviación 
estándar de la estatura de los alumnos. 


7.18. Pruebas de hipótesis 


Es otra forma de estimar a los parámetros de una poblacion en estudio a través 
de una muestra elegida al azar. 


7.19. hipótesis estadística 


Es un supuesto acerca de la distribución de una variable aleatoria o sus 
paramentos de la población en estudio. En este libro se asume la distribución 
de la variable aleatoria y la prueba de hipótesis será con respecto a los 
paramentos, supuesto que puede ser rechazado o no, dependiendo de la 
muestra aleatoria. Una hipótesis se representa por la letra mayúscula H. Se 
supone que este supuesto lo hace el investigador con la experiencia en el 
campo de su competencia. 


Ejemplo: 


1. El peso promedio de las bolsas de cemento marca Andino es de 52.5 Kg. 


Н:и-52.5 Kg. 
2. La variabilidad de los pesos de las bolsas de cemento marca Andino es de 
1.7 Kg?. 
H : 0° =1ЛКе” 


3. El peso promedio de las bolsas de cemento marca Andino es por lo menos 
52.3 Kg. 


H : u 252.3 Kg. 


Tipo de hipótesis 


La Hipótesis estadística puede ser Nula (llamada también planteada) 
simbolizada рог Ну alternante simbolizada por H, 


Hipótesis Nula о Planteada ( H, ) 


Es la hipótesis estadística, sobre la cual el investigador está dispuesto a creer a 
priori como verdadera, y cuya validez será sometida a comprobación 
experimental. La hipótesis nula (hipótesis que no cambia) se formula con la 
finalidad de ser rechazada pero con una probabilidad bien pequeña (0.1, 0.05, 
0.01), en caso de obtener una muestra desafortunada, es decir una muestra 
con valores muy altos o valores muy bajos. 


Hipótesis Alternante (Н...) 


Representa la creencia o sospecha que el investigador quiere probar si se 
rechaza la hipótesis nula (hipótesis de investigación) 
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Nota: cuando el parámetro asumen un solo valor, se le llama hipótesis simple, y 
cuando se prueba a más de un parámetro se le llama hipótesis compuesta.. 


Ejemplos: 


El jefe de planta de una empresa dedicada a la producción de detergente 
afirma al gerente de la empresa que el peso promedio del contenido de las 
bolsas es de 250 grs. Para verificar tal afirmación el gerente, toma una 
muestra al azar de 20 bolsas de la producción de un día determinado, y estará 
satisfecho con tal afirmación del jefe de planta si la media de la muestra se 
encuentra entre 250+1.5, Es decir para valores inferiores a 250-1.5=248.5 se 
rechaza la hipótesis, así como para valores superiores a 250+1.5=251.5; luego 
la hipótesis planteada y alternante es: 


Н,:и-250 grs. 
Н,: и ғ 250 grs. 


Ejemplo 
Sea el modelo 
у= & + Вх + 8х, += 


Se desea probar que los coeficientes son nulos ( que las variables х no influyen 
en y). 


H,:P,=P,=0 
H,=algun В, 0 


7.20. Estadística ае prueba 


Se denomina así а la regla de decisión utilizada para no rechazar о rechazar 
una hipótesis planteada. Esta decisión se basa en los resultados de la muestra 
y la estadística de prueba. 


En el ejemplo anterior la regla de decisión para rechazar la hipótesis planteada 
seria en cualquiera de los dos casos la siguiente: 


х<250-1.5-2485 6 х>250+1.5 = 251.5 


O no se rechaza la hipótesis planteada si y solo si: 


248.5<x<251.5 


Esto equivale a elegir una probabilidad bien pequeña llamada © рага 
rechazar la hipótesis planteada, en caso que obtengamos una muestra 
desafortunada (valores muy bajos o valores muy altos). 
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Los valores que toman puede ser: «=0.1, 0.05, 0.01, es decir con 
estos niveles de probabilidad rechazamos la hipótesis nula. 


7.21. Región critica o de rechazo de Н, 


Es la región que contiene los valores muestrales de la distribución de la 
estadística de prueba, para lo cual se rechaza la hipótesis nula. 


7.22. Región no rechazo de Н, 


Es la región que contiene los valores muestrales de la distribución de la 
estadística de prueba, para lo cual no se rechaza la hipótesis nula. 


La decisión de aceptar o rechazar la hipótesis nula con base a la información 


de la muestra aleatoria extraída de la población en estudio, está sujeta a dos 
tipos de errores que son debido a las fluctuaciones del muestreo. 


7.23. Tipos de errores 
Error tipo 1 


Consiste en rechazar la hipótesis nula H, con la información de la muestra, 
cuando esta es cierta en la población. 


Error tipo 11 


Consiste еп no rechazar la hipótesis nula Н, con la información de la muestra, 
cuando esta es falsa en la población. 


Con estos dos tipos de errores se presenta el siguiente cuadro resumen: 


Cuadro resumen 


DECISION EN LA POBLACION EN ESTUDIO 
TOMADA POR 
LA MUESTRA Н, ESCIERTA H, ES FALSA 
H, SEACEPTA | DECISION CORRECTA ERROR TIPO ПІ 
Н, SE RECHAZA ERROR TIPO 1 DECISION CORRECTA 


7.24. NIVEL DE SIGNIFICACION С 


El nivel de significación с, es la probabilidad de cometer el error tipo | (siendo 
en la poblacion la hipótesis verdadera se rechaza a consecuencia de la 
muestra), sabiendo que la hipótesis nula es casi segura de cumplirse, se le 
otorga una máxima probabilidad o importancia para rechazarla H,) 
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а = P(cometer el error tipo Г) = P(rechazar Н , / H „ es cierta) 


7.25. Nivel de significación /P 
El nivel de significación д, es la probabilidad de cometer el error tipo 11 
В = P(cometer el error tipo II) = P(aceptar Н „/ Н „ез falsa) 


Nota: Existe una relación inversa entre los dos tipos de errores (1 y II), es decir 
cuando uno de ellos decrece el otro aumenta y viceversa. 


7.26. Potencia de la prueba 4-0 


Es la probabilidad de по rechazar la hipótesis alternante dado que esta es 
verdad. 


1- В = Р(асеріа H, / Н, es cierta) 


7.27. Pasos а seguir para probar una hipótesis estadística 


a. Plantear la hipótesis nula y alternante en términos del enunciado del 
problema 

Elegir el nivel de significación para la prueba 

Estadístico de prueba 

Supuestos para dar validez a la prueba de hipótesis 

Región critica( Región de rechazo de la hipótesis planteada Hp) 
Cálculos 

Decisión y conclusiones. 


espa y> 


7.28. Pruebas de hipótesis para la media de una población 


Sea una población en estudio, en la cual se define una variable aleatoria de 
interés X , supongamos que la variable tiene una distribución normal con 


А . 2 А „Ж А 
media Ш y varianza O”, de dicha población se toma una muestra aleatoria 
Хз A Aa 
estadísticos: 


obteniéndose la media muestral Х. Se demuestra que los 


х- ш 
РЕТІ кя ~Z(0;1) Se usará cuando la varianza de la población se 
о/уп 
сопосе. 
х-и 
~ 2(0;1) Se usará cuando la varianza de la población no se 
s/n 


conoce у n>30. 


х-ш 
гу! Гы-угі Se usará cuando la varianza de la población по se 
5/ уп 


conoce y п <30.. 
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1. Formulación de las hipótesis: 


Pruebas bilaterales Pruebas unilaterales 

Н,:и=и, H,: 424, H,: 42H, 
: H :u< Р 

H,: 4% p, a: HSH, Н„:и< ш, 


2. Nivel de significación para la prueba 


а = P(rechazarH , / H „, cierta) 


р? 


3. Estadístico de prueba: 


: : ИР 2 
бі se conoce Іа varianza de la población © 


El estadístico de prueba es: y _х-%_ 2001) 
ШЕЗЕГ ” 


. . 4. 2 
бі по se conoce la varianza de la población © y п < 30. 


El estadístico de prueba ез: p _ *74 „руу 
ES y NS 


4. En este punto los supuestos para la prueba son: 


a. La variable de interés en la población tiene una distribución normal. 
b. La muestra es extraída al azar. 

5. Región critica para la prueba (región de rechazo de la hipótesis nula), esta 
región se determina con la hipótesis alternante y el nivel de significación 
dado. La hipótesis alternante determina la región de rechazo esta puede 
ser bilateral (dos colas) o es unilateral (una sola cola de rechazo, bien 
sea a la derecha o izquierda) 


Supongamos que la prueba es bilateral (por la hipótesis alternante) la región 
crítica o de rechazo de la hipótesis planteada es: 


Z¿<Z, О 2,>2, Se rechaza la hipótesis nula, en caso 
contrario no se rechaza la hipótesis nula. 


2. Valor que se calcula con los datos de la muestra 


2, Valor que se calcula con la estadística de prueba que se usa y el 
nivel de significación с 


6. Decisión. Si el valor calculado caen dentro de la región critica, entonces 
se rechaza la hipótesis Н, пиа, la conclusión es existe evidencia 


estadísticas con un nivel de significación Y рага rechazar la hipótesis 
nula. 
Caso 1 
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H,:4=p, 
H,: 4% ш, 


Región critica para prueba bilateral: se conoce la varianza de la poblacion 


а 
-Z реа! 


Se rechaza la H,, de lo 


contrario no se rechaza. 
Si no se conoce la varianza de la población 


п –1)21 
0 AS 
—((®;п-1) (1-®;п-1) 
2 
Regla de decisión: 
Si шы” аа a Se rechaza la H ,, еп 


5) ( 155) 


caso contrario no se rechaza 


Caso 2 
Н„:и< a, 
A, :4>H, 
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Si se conoce la varianza de la población 


ж 
24-о) 


Se rechaza la н,, еп caso contrario по rechaza. 


Regla de decisión: 


Si 2,>2 


(1-а) 


бі по se conoce la varianza de la población 


п 1)21 


е 
11-0; п –1) 


Regla de decisión: 


бі Т.>1,,,, Serechaza la Н,, еп caso contrario se acepta. 
7. Calculo del estadístico de prueba: Z, о T, 


8. Conclusiones 


Si el valor calculado cae en la zona de rechazo, entonces se rechaza la 
hipótesis nula con un nivel de significación о y se concluye que la prueba 
ha sido significativa de lo contrario la prueba no se rechaza. 


Ejemplo-1 


Los montos por ventas diarias de una tienda comercial se distribuye 
normalmente con media и y desviación estándar S/. 3,600. Probar con un 
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nivel de significación del 5% (0.05) de que el monto promedio por ventas de la 
tienda comercial es diferente a los S/. 20,000. Una muestra elegida al azar de 
20 ventas arroja un monto promedio de S/.19, 500. 


1. H,:u=20,000 
H „ : u + 20,000 


2. Nivel de significación para la prueba 
а = 0.05 = P(rechazarH , / H „, cierta) 


3. Estadístico de prueba: como la varianza de la población es conocida, el 
estadístico de prueba es: 


x-4 | 
Z, === ~ 7(01)/Н, Cierta 
oln 5 
4. Como la prueba es bilateral (por la hipótesis alternante), el nivel de 


significación с = 0.05 lo dividimos en dos partes un área de 0.025 a la 
izquierda y 0.025 a la derecha con sus respectivos valores de abscisa; 
es decir Z(0.025) = –1.96 y Z(0.975) =1.96, valores obtenidos de la tabla 


Normal estándar, tal como se muestra en el siguiente gráfico: 


-1.96 0 +1.96 


Si -1.96<2, <1.96 Nose rechaza la hipótesis planteada, en caso contrario 
se rechaza 


5. Calculo del valor del estadístico 


z ХА, _ 19,500 — 20,000 _ 


р —— 0.621129993 
сіп 3,600/- 20 


6. Como el valor calculado con los datos de la muestra, cae dentro de la 
región de no rechazo, por lo tanto no se rechaza la hipótesis nula. 


7. Conclusión: Con un nivel de significación del 5%, los datos de la muestra( 
evidencia muestral ) no permite rechazar la hipótesis nula de que el monto 
promedio por venta diaria es igual a los S/.20,000. 
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7.29. El_ Р valor 


Otro método para rechazar o no rechazar la hipótesis nula Н,, es obtener la 


probabilidad del valor calculado del estadístico (hipótesis alternante), y 
compararlo con el nivel de significación о, por un razonamiento: 


si «>р Serechaza H, 


si a<p Noserechaza Н, 


El valor p, para esta prueba de dos colas esta dado por: 
Si Т > Tama > se rechaza Н, 


calculado tabla 


р valor =P(T >T, )<P(T > Tor) = > 0 >p>se rechaza Н, 


аісшайо 
En caso contrario по se rechaza. 
Para la prueba bilateral 


p=P(Z<Z )+P(Z>Z,) 
p = P(Z <-0.621129993) + Р(Х > 0.621129993) = 2.P(Z < —0.621) =2(0.267257048) 
р = 0.534514096 = 0.5345 


Este valor de P es comparado con el nivel de significación с = 0.05 dado: 


Conclusión 


Como el nivel de significación с = 0.05 es menor que el valor p=0.5345, no se 
rechaza la hipótesis nula. 


Ejemplo-2 
Sea X una variable aleatoria que representa el peso (Kg.) de un recién nacido, 


2 
cuya distribución es aproximadamente normal con media q y varianza O 


Probar con un nivel de significación de 0.05, de que la media de la población es 
superior a 3 kg, si una muestra aleatoria de tamaño 30 arroja una media de 
2.96 y una varianza de 0.25. 


1. Н,и<30 
Н,:и>3.0 
2. Nivel de significación para la prueba 
а = 0.05 = P(rechazarH , / H,, cierta) 
3. Estadístico de prueba: como la varianza de la población es desconocida, 
el estadístico de prueba para es te caso es: 
FM 


T. 9 
s/n 


4. Como la prueba es unilateral a la derecha (por la hipótesis alternante) la 
región critica o de rechazo de la hipótesis planteada es: 


-t(n—-1)gl/H, Cierta 
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Т, > Т, 


(0.05,29) gl > 
se rechaza; de la tabla T, se tiene: 


se rechaza la hipótesis nula H,,en caso contrario no 


Т. >1.699, se rechaza la Hipótesis nula Н,, еп caso contrario no 


se rechaza. 
5. Cálculo del valor del estadístico 
т-Х1%- 2.96-3.0 2 0.438 
E sinn 0.25/-..30 
6. Como T, --0.438 < 1.699, No se rechaza la hipótesis planteada. 


7. La muestra elegida a azar no permite rechazar la hipótesis nula a un nivel 
de significación del 5%. 


Con el valor p valor, obtenido con Minitab: 
p = P(t, >-0.438)- 0.667 
Luego: 


а = 0.05 < p = 0.667 


No existe suficiente evidencia estadística para rechazar la hipótesis nula de 
que el peso promedio en la poblacion de recién nacidos sea menor o igual a 
los 3 kg., con un nivel de significación del 5%. 


Ejemplo-3 


r ï __296-3.0 
€ sión 0.25 /-.30 


= —0.438 


De la pregunta anterior, para que valores del estimador X se rechaza la 
hipótesis planteada. 


Se rechaza la hipótesis planteada siempre y cuando: 


T. >1.699 >= >1.699 >x >1.699. +3 
S n n 


x > 1.699. "2 +3 = 3.15510 


Es decir para valores del estimador superior а 3.15510, se rechaza Іа hipótesis 
nula. 


Si elegimos 3.2 kg 

e о х-ш, 32-30 
“sim J025/4/30 
p = P(t, > 2.19089023) = 0.01832 
а =0.05> р= 0.01832 


Conclusión: Se rechaza la hipótesis planteada. 


=2.19089023 
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Ejemplo-4 


De la pregunta anterior si realmente la media de la población es 5, que tipo de 
error se está cometiendo. 


Como en la pregunta № 2 la hipótesis planeada fue aceptada a causa de la 
muestra cuando realmente el valor de la media poblacional es 5, bajo esta 
circunstancia se estaría cometiendo el error tipo ll. 


7.30. Prueba de hipótesis para la varianza de una poblacion 


Sea Х, una variable aleatoria con distribución normal con media conocida // 


А А 2 А sz . 

y varianza desconocida б”, de dicha población se toma una muestra aleatoria 
iğ Б 2 

Хх,Х2,..Х,, Obteniéndose la varianza muestral Ss”. Se demuestra que el 


па 
estadístico. 
(п=1)=2 , 
7-02 Жош 
Formula que se utilizará para las pruebas de hipótesis con respecto a la 


varianza de la población 


4. Formulación de las hipótesis: 


Pruebas bilaterales Pruebas unilaterales 
да 22 2 2 2 2 
Н„:о =о, H,:0 <o; H,:0 20, 
¿nd 2 212 2 
Н,:6” жо) H,:0*>0? H,:0*<0,) 


5. Nivel de significación para la prueba 


а = P(rechazarH , / H „, cierta) 


р? 
6. Estadístico de prueba: 


2_(n- Ds? 


~ ж? (n- Del/H, Cierta 


с 2 


7. Como la prueba es bilateral (por la hipótesis alternante) la región critica o de 
rechazo de la hipótesis nula es: 


<, б д>? „ Se rechaza la hipótesis nula, en caso 
(ЕЯ (1-=,п=1) 


n-1) 


contrario no se rechaza la hipótesis planteada. 


Ejemplo aplicativo 


Sea X una variable aleatoria que representa la estatura de estudiantes de una 
universidad, cuyo comportamiento es normal con media Æ у varianza 


desconocida с”, se tiene información de que la varianza de las estaturas de 
los estudiantes en la población es de 0.041 m?, para verificar dicha hipótesis 
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se toma una muestra aleatoria de 20 estudiantes, obteniéndose una varianza 
muestral de las estaturas igual a 0.039 m2. Probar la hipótesis con un nivel de 
0.05. 


1. Hipótesis a probarse 
е 6: о? = 0.041 
H,:0* + 0.041 
2. Nivel de significación para la prueba 


а = 0.05 = P(rechazarH, /Н,, cierta) 


р? 
3. Estadístico de prueba, es: 


2 (п-1)в7 
Xe = 


2 


~g’ n- Del/H, Cierta 


4. Como la prueba es bilateral (por la hipótesis alternante) la región critica o 
de rechazo de la hipótesis planteada es: 


X< Xans Ó Ж; > Хоол Se rechaza la hipótesis planteada, en 
caso contrario se acepta; de la tabla Chi-cuadrado se tiene: 


72<8907 6 у2>32.852 


5. Cálculo del valor del estadístico 
yo = Ms 00-009 _ 13.073 
о: 0.041 
6. Como yz? =18.073 , nose rechaza la hipótesis planteada, los datos de la 


muestra no proporciona la evidencia estadística para rechazar la hipótesis de 
que la varianza de las estaturas en la población sea igual a 0.041 m? 


7.31. Prueba de hipótesis de homogeneidad de dos varianzas poblacionales 


Ejemplo 

Sean dos poblaciones normales e independientes x= Tiempo de vida de una 
pila eléctrica de marca A, e Y = Tiempo de vida de una pila eléctrica marca B. 
De cada población se extraen muestras de tamaño 8 y 12 y se obtiene por 
varianza 4.162 y 3.415 respectivamente. Probar con un nivel de significación de 
0.1 de que las varianzas de ambas variables son diferentes. 


КӨЕ, Ol 
1. H,:0, -ө; 


9 2 
H,:0 +0; 


2. Nivel de significación para la prueba 
а =0.1 = P(rechazar Н „/ H,, cierta) 
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3. Estadístico de prueba es: 


2 
ma zF 


с 52 (тљ=1; п-=1) gl 
2 


/Н, Cierta 


4. Сото la prueba es bilateral (por la hipótesis alternante) la región critica o 


de rechazo de la hipótesis nula es: 
Е. > Foss) 0 Е <Е 


(0.05;7,11) 
o también la región de aceptación es: 


Si Foos711) SF. < Еоөөл.і) se acepta la hipótesis planteada, en 
caso contrario se rechaza; de la tabla F-Snedecor se tiene: 


бі 0.278<Е <3.01 no se rechaza la hipótesis nula, en caso contrario 


se rechaza. 
5. Cálculo del valor del estadístico 
2. 
кей. 4100219 
52 3415 
6. Como ХЕ, =1.219 , nose rechaza la hipótesis nula; es decir los datos 


de la muestra no permiten rechazar la hipótesis nula de homogeneidad de 
varianzas poblacionales. 


7.32. Prueba de hipótesis para la diferencia de dos medias poblacionales 


Caso-1 
Cuando las dos varianza poblacionales o; у о», son conocidas 


Sean X e Y dos variables aleatorias independientes con distribución normal 


Же(ш о) у Y ~ (4, 507); de ambas poblaciones se extraen muestras 


aleatorias independientes de tamaño п y п, , obteniéndose sus 


respectivamente medias muestrales X у У. Supongamos que planteamos 
las siguientes hipótesis: 


Pruebas bilaterales pruebas unilaterales 
H, : 141 =H) H, : 4 S 4n H,: 1214) 
H,: 4 * 1) H, : 4 > ш, H, : 4 < и, 


Nivel de significación para la prueba с = P(rechazar Н „/ Н ,,еѕ cierta) 
El estadístico para las pruebas es: 


Z = (х-у)-(ш — 4) 


ё 


—7(0;1) 
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Las regiones críticas de rechazo de nula H,son: 
Pruebas bilaterales 


Si 2.<2 о 27,>2 en cualquiera de los casos se rechaza la hipótesis 
(1 


a? 


2) 


а 


(5) 


пиа 
Pruebas unilaterales (región de rechazo а la derecha) 
бі 2,>2 


a-a)» Se rechaza la hipótesis nula. 


Pruebas unilaterales (región de rechazo a la izquierda) 


Si Z, < ZĘ se rechaza la hipótesis nula. 


Caso-2 


Cuando las dos varianza poblacionales o? у с:, son desconocidas у 
homogéneas. 


Sean X e Y dos variables aleatorias independientes con distribución normal 
Х-(ш о) у Y ~ (4, 50); de ambas poblaciones se extraen muestras 
aleatorias independientes de tamaño п y п, , obteniéndose sus 


respectivamente medias y varianzas muestrales (х, 52 ) у (у;52) 


Supongamos que planteamos las siguientes hipótesis: 


Pruebas bilaterales pruebas unilaterales 
H, : 41 = 4 H, : 4 S ши, H, : 44 2 ш, 
H, : 4% 1) H, : 4 > ш, H, : 4 <p) 


Nivel de significación para la prueba о = P(rechazar Н, / H, es cierta) 
El estadístico para las pruebas es: 


z (х-у)-(ш -11,) Ө 
е 1 1 (лү+п›—2)е1 


Sy +— 


р 


t 


n отп, 


Siendo: y , la varianza ponderada 


› (т -Ds + (п, Ds; 
á n +n, -2 


Las regiones críticas de rechazo son: 


Pruebas bilaterales 
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Si t,<t, о t,>t , ,serechaza la hipótesis nula.. 


е а 
ізі pa 
P ( 2) 


Pruebas unilaterales (región de rechazo а la derecha) 


Si t >t se rechaza la hipótesis planteada 


1-а)? 
Pruebas unilaterales (región de rechazo a Іа izquierda) 


Si t, <t,,, se rechaza la hipótesis planteada 


(a)? 


Caso-3 


Cuando las dos varianza poblacionales с? c2, son desconocidas 
ШЕ 2 
heterogéneas 


Sean X e Y dos variables aleatorias independientes con distribución normal 
X —(д,; о) y Y~ (и ;03); de ambas poblaciones se extraen muestras 
aleatorias independientes de tamaño п y п, , obteniéndose sus 


respectivamente medias y varianzas muestrales (5,52) y (у;5;) 
Supongamos que planteamos las siguientes hipótesis: 


Pruebas bilaterales pruebas unilaterales 
H , : 44 = 4, H, : 4 Sn) H , : 4 21) 
H, : 4,41, H, : 4 > и, H, : 4 < и, 


Nivel de significación para la prueba а = P(rechazar Н, / H,,es cierta) 
El estadístico para las pruebas es: 


(х-у)-(ш-ш) КИ 


і 2 (k)gl 


č 


s pi 
т тп, 
s? s? 
Biy 
Siendo: (5------5,,, los grados de libertad de la distribución t. 
51 у2 52 у2 
ET СЭ 
i 4 п, 


n=l n,-1 
Las regiones críticas de rechazo de H, son: 


Pruebas bilaterales 
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Si т<! o t.>t , ,serechaza la hipótesis planteada. 
( Ж 


а 2) 
Pruebas unilaterales (región de rechazo a la derecha) 


Si t. >л „у, se rechaza la hipótesis nula. 


Pruebas unilaterales (región de rechazo a la izquierda) 


Si t, <t» Se rechaza la hipótesis nula. 


a)? 


Ejemplo aplicativo-1 


Sean dos poblaciones normales e independientes x= cantidad de artículos por 
revistas científicas A, e y= cantidad de artículos por revistas científicas B. De 
cada población se extraen muestras de tamaño 35 y 40, para la primera 
muestra el promedio de la cantidad de artículos por revista es de 16 y varianza 
16, para la segunda muestra la cantidad promedio del número de artículos por 
revista es de 18 y varianza 17. Probar con un nivel de significación de 0.1 de 
que las medias de las poblaciones son diferentes. 


1. H, : 4 = 4 
H, : 44H 


2. Nivel de significación para la prueba а =0.1= P(rechazar Н, / H „, cierta) 


3. Estadístico de prueba, dependerá si existe o no homogeneidad de 
varianzas poblacionales. 


Entones probemos la homogeneidad de varianzas poblacionales: 


2 2 
H,:0¡=0) 


22 2 
Н.с жо, 


Para la prueba de homogeneidad еі estadístico de prueba ев: 


КЕ 


с T © Қ, 1 9а 
5; 


/Н, Cierta 


4. Como la prueba es bilateral (por la hipótesis alternante) la región critica о 
de rechazo de la hipótesis planteada es: 


Si F.<Foos3439 0 Ё > Fioss:34,39) se rechaza la hipótesis 


planteada, en caso contrario no hay la suficiente evidencia estadística 
para rechazar la hipótesis nula. De la tabla F, se tiene: 


Е <0.5126 о Е >1.922, en ambos casos se rechaza la hipótesis nula. 
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3. Cálculo del valor del estadístico 


F, = 16 -0.9412 
17 


1. Como F,=0.9412 , por lo tanto se concluye que no hay la suficiente 


evidencia estadística para rechazar la hipótesis nula de homogeneidad de 
variancias poblacionales. 


Luego el estadístico para las pruebas es: 


_(x-y)- (u - 4h) 
S 1,1 


р 
т A, 


t, Е ben +n,—2)gl 


Siendo: ; , la varianza ponderada 


2 (т —Ds; +(n, —1)5; 
E n +n, -2 


Región critica para esta prueba 


Si 1, < toos: =71.666 о t, >tossz) =1.666, se rechaza la hipótesis 
planteada. 


Cálculo del valor del estadístico 
Primero calculamos la varianza ponderada 


‚„ _ (85-116 + (40 —1)17 
; (35+40-2) 


=16.53424658 > S, =4.06623 


Т. = ESTAS --2.125 


|! 6.53424658(— + Es 
35 40 


Luego con T, --2.125, se rechaza la hipótesis nula, con un nivel de 


significación del 10%, existe evidencia estadística para rechazar la hipótesis 
nula de que las medias poblacionales son iguales. 


Ejemplo aplicativo-2 


Sean dos poblaciones normales e independientes x= cantidad de artículos por 
revistas científicas A, e y= cantidad de artículos por revistas científicas B. De 
cada población se extraen muestras de tamaño 35 y 40, para la primera 
muestra el promedio de la cantidad de artículos por revista es de 16 y varianza 
16, para la segunda muestra la cantidad promedio del número de artículos por 
revista es de 18 y varianza 40. Probar con un nivel de significación de 0.1 de 
que las medias de las poblaciones son diferentes 
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1 Н„:щ=һ, 
H, : 41% и, 


2. Nivel de significación para la prueba «=0.1=P(rechazar Н,/Н,, cierta) 


3. Estadístico de prueba, dependerá si existe о no homogeneidad 
varianzas poblacionales 


prueba de la homogeneidad de varianzas poblacionales: 


E 242 
H,:0, -б; 


ИЕ: 2 
H,:0(*+0, 


Como la prueba es bilateral (por la hipótesis alternante) la región critica o de 
rechazo de la hipótesis planteada es: 


Si F.<Foos3439 0 F.>Foss3439 se rechaza la hipótesis 


planteada, en caso contrario no hay la suficiente evidencia estadística 
para rechazar la hipótesis nula. De la tabla F, se tiene: 


Е, <0.5126 о F.>1.922,en ambos casos se rechaza la hipótesis nula. 


4. Cálculo del valor del estadístico 
16 


у=-——=04 
40 


5. Como Е =0.4 , porlo tanto se concluye que hay la suficiente 


evidencia estadística para rechazar la hipótesis nula de homogeneidad 
de variancias poblacionales. 


de 


Luego usamos el estadístico correspondiente para la prueba de las medias 


poblacionales 


EY) (4174) _, 
с 2 2 (k)gl 
SiS) 
— + —= 
о тп, 


ax (шд) 16-18—0_ 


1. 2 g? 16 40 bps 
ss | 
2L aj =) 
| n, тты 35 40 
Con k grados de libertad 
2 2 
5р ,%y 16 40 
—= y АБЕ Айы, Y 
Cr z 57% 
іІ-------- =66.79=67 gl, 
ty Ey Ey (Фу 
m m 35 40 


al ua MA 
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Región critica para esta prueba 


Si t, < L(0.05:67) O t, > L0.95:67) , se rechaza la hipótesis nula. De la 
tabla T Student, se tiene los valores tabulares: 


t, <-1.668=-1.67 о t,>1.668=1.67 


Luego como Т,--1.6568--1.66, рог lo tanto no existe la suficiente 


evidencia estadística para rechazar la hipótesis nula, de que la medias 
poblacionales son iguales. 


Gráfica de distribución 
Т; df=67 


0.3 


0.2 


Densidad 


0.1 


0.0 
-1.668 0 1.668 


7.33. Prueba de hipótesis para una proporción 


Sea una poblacion de tamaño М, con dos cualidades A y В, con n(4) y n(B) 


elementos respectivamente, la proporción de elementos con la cualidad de 
interés A en la poblacion se define por: 


п(4) 
A, =P= N 
Y tiene por varianza: 
с? =P(1-P) 


Para la proporción de la poblacion se pueden plantear cualquiera de las 
siguientes hipótesis: 


H,:P=P, H,:PSP, H,:P>P, 
Н.:РжР, H,:P>P, H,:P<P, 


Y para rechazar la hipótesis nula elegimos un nivel de significación: 
а =1%(0.01), 5%(0.05), 10%(0.1) 
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Teorema 


Е ЖА» ЕН TEN В 
Sea la proporción muestral =>, siendo "х" el número de elementos соп la 
п 


cualidad de interés en la población у "л" el tamaño de la muestra, si 


=P А 
пЭ о (и> 30), entonces Zç = Р ~ №0; 1) , corresponde al estadístico de 
р 
prueba. 
Siendo: 
о? = РО) Si el muestreo es con reemplazo 


р 
i n 


2 Р-р), N-n 
e PI SN 
Р п Сут) 


Si el muestreo es sin reemplazo 


Ejemplo aplicativo: 


Los datos que a continuación se presenta corresponden a una muestra 
aleatoria de la cantidad de artículos científicos publicados por cierta revistas 
científica en ciencias matemáticas. 


Cantidad de artículos publicados 
13, 15, 13, 12, 20, 23, 10, 12, 15, 19, 24, 23, 12, 14, 15, 


17, 13, 16, 18, 12, 13, 14, 12, 17, 18, 12, 15, 14, 19, 26, 


25, 25, 11, 13, 14, 15, 17, 21, 18, 23. 


¿Probar con un nivel de significación del 5% que la proporción de revistas con 
más de 15 artículos publicados es superior al 42%? 


Pasos 


1. Hipótesis a probarse 
Н,:Р<0.42 


Н,:Р> 0.42 
2. Nivel de significación de Іа prueba 
а =0.05=P(rechazar la H,/H,, cierta, en la población) 


3. Estadístico de prueba 


apor 


~ N(0,1) 
Da 
4. Supuestos: 


a. Las observaciones son elegidas aleatoriamente 
b.  Eltamaño de muestra es grande 


135 


5. Criterio de decisión 


0 1.645=Z(0.95) 


Se acepta H, ,si 27, <1.645, еп caso contrario se rechaza. 


6. Cálculos, de los datos se tiene: 


Tamaño de la muestra Numero de revistas con 
más de 15 artículos 
40 18 


Соп n,=40 р, = 5 -0.45, se tiene que la 


Е - [3 T ИТР 
Pa n 40 


_ 0.450,42 


¿== -0.3844 
0.078038 


7. Conclusión 


Como el Z, -0.3844 <1.645; luego по se rechaza la hipótesis planteada y se 


concluye para a =0.05que las evidencias muestrales indican que la proporción 
de de revistas con más de 15 artículos no es superior a 0.42 ( 42%) 


Como para todas estas pruebas se utiliza es estadístico Z, se presenta la 
siguiente tabla para valores clásicos del nivel de significación: 


prueba alternante Nivel de significación de la prueba 
0.01 (1%) 0.05 (5%) 0.1 (10%) 
2 colas -2.576 y 2.576 -1.96 y 1.96 -1.645 y 1.645 
1 cola a la derecha 2.326 1.645 1.282 
1 cola a la izquierda -2.326 -1.645 -1.282 
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7.34. 


1. 


7.35. 


Ejercicios propuestos: 


Sean dos poblaciones normales e independientes X= Tiempo de vida de 
una pila eléctrica de marca A, e Y= Tiempo de vida de una pila eléctrica B. 
De cada población se extraen muestras de tamaño 20 y 15, se obtiene 
para la primera muestra una media de 5000 y una desviación estándar de 
500, para la segunda muestra se obtiene una media de 4800 y una 
desviación estándar de 300. Probar con un nivel de significación de 0.1 
de que la media de la población X es superior a la media de la población 
Y. 


Probar la hipótesis con un nivel de significación de 0.05 de que la media 
población es diferente de 3.5 K g, si por estudios pasados se sabe que la 
varianza del peso por planta de la hectárea sembrada es de 0.176K2. 


De la pregunta anterior responder: 


a. Рага que valores del estadístico se rechaza la hipótesis nula. 

b. Si realmente la media poblacional del peso por planta es de 3.8 Kg. 
Qué tipo de error se estaría cometiendo. 

с. Probar la hipótesis con un nivel de significación de 0.05 de que la 
varianza de la población es superior a 0.2 


Una compañía desea probar la resistencia de dos tipos de viga de acero 
A y В, para esto toma muestras aleatorias de 15 vigas de cada tipo de 
viga, obteniéndose los siguientes resultados. 


TIPO MEDIA VARIANZA 
A 70.5 81.6 
B 84.3 280.5 


Probar con un nivel de significación 0.1 de que las medias de ambas 
poblaciones de resistencias son diferentes. 


Una de las maneras de mantener bajo control la calidad de un producto 
es controlar su varianza. Una máquina para enlatar conservas de pescado 
está regulada para llenar con una desviación estándar de 10 grs. y peso 
promedio 500 grs. El peso de cada lata con conserva sigue una 
distribución normal. Afirmaría Ud. Que la maquina һа sido 
adecuadamente regulada en relación a la varianza, si una muestra de 16 
latas con conserva dio una varianza de 169 grs. Use para la prueba un 
nivel de significación de 0.05. 


Prueba de hipótesis para muestras dependientes o pareadas 


Sea X una variable definida en una poblacion con ddistribución normal 
con media y y varianza с? , se extrae una muestra aleatoria de tamaño 
n y para cada valor se registran dos valores antes y después de un 
experimento, tal como se presenta en la siguiente tabla. 
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TABLA 


Observaciones X (antes) Y (después) D=X-Y 
1 X, Y, D, = X, = Y, 
2 X, Y, р, =X,-Y, 
3 X, Y, D, = X, -Y, 
n X, Y, D, =X, Y, 


La variable aleatoria D = X – У, tiene una distribución normal con media 
lp = иу — ш, y varianza op = У(Х) + (у) – 2Соу(Х,Ү), para la muestra 
antes y después: la media y varianza muestral son: 


d=x-y 


Y (х,-у,-(х-у))* 
82 =. 


n-1 


La variable aleatoria 


se distribuye como una Т, уу 


Este estadístico se utiliza para probar las siguientes hipótesis para un 
nivel se dignificación de с . 


H,:D=0 H,:D20 H,:D<0 
Н,:Пж0 H,:D<0 H,:D>0 


Ejemplo aplicativo 


Se eligen 20 estudiantes al azar y se rregistran sus notas de matemática 
antes y después de recibir el apoyo de un profesor particular, los datos se 
presentan en la tabla. Probar con un nivel de significación del 5% que las 
notas antes y después son diferentes. 
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H,:D=0> H,:Hy=Hy=0 
H,:DA0> H,: Uy -My%0 


Nivel de significación para la prueba 
a =0.05 = P(rechazar H,/H, es cierta en la poblacion) 
Cálculos: 


4-х-у--15 


У =y; -(х-у)) 


sa | = 6.92857143 > S, =2.63221797 
Е 
d-u -1.5-0 
T= n = -2.673 
e S, 2.63221797 ? 
Үп 22 


Región de rechazo de la hipótesis nula 


Gráfica de distribución 
Т; df=21 


0.4 


0.3 


0.2 


Densidad 


01 


0.025 0.025 
0.0 - 
-2.080 0 2.080 


Decisión y conclusión: se rechaza la hipótesis nula 


T, = -2.673 < T, 


abul = 2.08, a un nivel del 5% la evidencia de la muestra 
indica que hay diferencias significativas en las notas antes y después. 
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TABLA: Notas de los estudiantes antes y después 


N° x=antes y=después d=x-y 
1 5 10 -5 
2 8 10 -2 
3 12 14 -2 
4 17 18 -1 
5 13 15 -2 
6 16 14 

7 17 15 

8 11 14 -3 
9 12 12 

10 18 16 2 
11 12 12 

12 13 15 -2 
13 14 12 2 
14 15 17 -2 
15 14 13 1 
16 13 15 -2 
17 14 17 -3 
18 18 19 -1 
19 10 16 -6 
20 13 12 1 
21 15 -6 
22 13 -6 


7.36. Intervalo de confianza para la verdadera diferencia de media 


Un intervalo de confianza del (1 – «)100% para la verdadera diferencia de 
media para la muestra pareada es dada por: 


za. Т" 
IC(u,-m,)=x-y+t, ~= =d +t, $ 
i 2 vn 2 [vn 


Del ejemplo anterior, un intervalo de confianza del 95% para la verdadera 
diferencia de media pareada en la poblacion es dado por: 


2.63221797 


/22 


Interpretación: existe una confianza del 95% de que el intervalo 
[- 2.667;-0.333], contenga a la verdadera diferencia de medias pareada en 


la poblacion. 


IC(u, – 1,) = –1.5+2.080. ->|-2.667 ; -0.333| 
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Aplicando MINITAB. 
IC y PRUEBA T PAREADA: X=ANTES; Y=DESPUÉS 
ESTADÍSTICAS DESCRIPTIVAS 


Error 

estándar 

de la 

Muestra М Media Desv.Est. media 


x=antes 22 12.773 3.477 0.741 


y=después 22 14.273 2.394 0.510 
Estimación de la diferencia pareada 


Error 
estándar 1С de 95% para 
de la la 
Media  Desv.Est. media  diferencia_u 


-1.500 2.632 0.561 (-2.667; -0.333) 


аіїегепсіа џи: media de (x=antes - y=despues) 
Prueba 
Hipótesis nula Ho: аіѓегепсіа р = 0 
Hipótesis alterna Ні: аіѓегепсіа р е 0 
Valor T Valor p 
-2.67 0.014 


7.37. Pruebas no paramétricas 


e No se requiere conocer la distribución de probabilidad de variable que se 
estudia 


e Se utilizan para variables nominales u ordinal 
e La prueba es con referencia a un valor estadístico 
• Muestra pequeña n<30 


7.38. Aplicaciones de la distribución chi cuadrado 


Sea una población en estudio, X una variable de interés, la cual es dividida en 
Ху, Х,,...Х,,...Х,, clases o categorías mutuamente excluyentes, tal que: 


Sea р, , la probabilidad de ocurrencia de algún elemento de la categoría X, 
(1=1, 2, 3,..., К); es decir, 


k 
Р(Х,) = p,,talque: P:Z0 y Ур, =1 

і=1 
Supongamos que еп la población en estudio, se toma una muestra al azar de 
tamaño "л", y representemos por O, al número de elementos de la muestra 


que le corresponde а la categoría X,, resultados que se presentan еп la 
siguiente tabla. 


141 


TABLA 1 


Clases o categorías O. 
de la variable en la ! 
población 
Ai O, 
X, O, 
X, O, 
X, O, 
k 
Total O, = п 
і-і 


La hipótesis a probarse es: 
Н =Los datos de la muestra provienen de una distribución teórica dada 


Н „= оз datos de la muestra no provienen de una distribución teórica dada 


Nivel de significación de la prueba: (Y =0.01; 0.05; 0.1; P(rechazar H, / H, es 
cierta). 


El estadístico de prueba: 


Suponiendo la hipótesis nula cierta, el número esperado observado, para cada 


clase X, (i=1,2,3,..., К), es 


Е(Х,)=пр,=е (i=1,2,3,..., k) 
TABLA 02 
Clases o categorías O, (cantidad de datos | e, (Cantidad Че 
de la variable en 
estudio en la observados de |а |datos esperados 
oblación muestra para cada bajo Іа hipótesis 
Я clase) nula cierta en la 
población. 
X, O, е, 
X, O, е, 
А, О, е; 
X; O, е, 
k k 
Total XO, =n Уе-п 
ial i=l 
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De la tabla 02, si la hipótesis nula es cierta la diferencia entre (o, ЕЕ e,) tiende 


a ser un valor pequeño, de los contrario la hipótesis nula se rechaza a un nivel 
de significación a =0.01; 0.05; 0.1. La estadística para esta prueba es: 


£ (0, -e,) 
Va і МИЕ К Я Қ 
2: => ES Хала / Hipotesis nula cierta 
i=l і 


Siendo: 


к =М° de clases o categorías en la cual se ha dividido la población estadística. 
р =N" de parámetros estimados para calcular los e, 


Región Crítica para la Prueba 


2 
Si el valor calculado x es inferior o igual al valor tabular А-а; k-1-p) , la 
hipótesis nula no se rechaza, en caso contrario se rechaza. 


NOTA-1 
Para una prueba confiable es necesario que los e, >5, de no cumplirse este 


requisito, se debe agrupar las clases o categorías contiguas, por supuesto que 
esto reduce los grados de libertad para la prueba. 


NOTA-2 


Si el tamaño de muestra es menor a 50 y además tiene un solo grado de 
libertad, por la corrección de Yates el estadístico de prueba es: 


+ (fo; —e,] 0.5 
de X к Tiii 
гі 


е, 


і 


La distribución Chi-Cuadrado permite realizar las siguientes pruebas 
estadísticas: 


. Pruebas de frecuencias 

. Pruebas de bondad de ajuste 

. Prueba de independencia de dos variables 

Prueba de homogeneidad de muestras 

Prueba de homogeneidad de varianzas poblacionales. 


7.39. Pruebas de frecuencias 


Se encarga del estudio de las proporciones entre las clases en una tabla 
de distribución de frecuencias. 


H, : Pi =; p, =b; P, =t>a+b+..+t=1 
H ,: p, жар, +b;...,P, жі 
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Ejemplo 


Se desea probar con un nivel de significación del 5% que la concurrencia 
de usuarios a un centro de información no es la misma para los 5 días de 
la semana. Los datos se presentan en la siguiente tabla. 


ГА Frecuencias 
Frecuencias Proporción 
Días dela | observadas teórica |р ершн 
САЛА (probabilidad) НА 5 
O; (o, –е,) / e, 
Pi e; = пр; 

Lunes 530 1/5 620 1.4516129 
Martes 720 1/5 620 4.0322581 
Miércoles 650 1/5 620 0.1612903 
Jueves 580 1/5 620 0.6451613 
Viernes 620 1/5 620 0.1612903 
Total 3100 1 3100 6.4516129 


Hipótesis a probarse 
Н: р = р... = р; =1/5 
Н,:р, +115 і=1,2,3,4,5 


Nivel de significación рага la prueba а -0.05 


Bajo la hipótesis nula cierta la probabilidad de que concurran la misma cantidad 
de usuarios durante los 5 días de la semana es la misma e igual a 1/5. Luego 
las frecuencias esperadas se obtienen multiplicando las frecuencias 
observadas con sus respectivas probabilidades teóricas, dada por el enunciado 
del problema, es decir, 

e, = mp, і-1,2,3,4,5 
3100(1/5) = 620 


1 е; е; е, е; 


De la tabla el valor calculado 


5 = 2 
д? = NO” _6.4516129 
ігі е; 


Valor que comparado con el valor tabular 
| =y =y = 9.4877 
Ж 1-0:05;5-1-0) = Ж(о.95;5-1-о) = Ж(о.95;4) = 7 
Decisión: 
Como el valor calculado con los datos de la muestra es menor que el valor 
tabular, entonces no rechazamos la hipótesis nula; es decir durante los cinco 


días de la semana no se puede afirmar que la concurrencia de usuarios al 
centro de información sean diferentes. 
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7.40. Pruebas de bondad de ajuste 


Se utiliza para probar si un conjunto de datos de una muestra elegida al 
azar, se ajusta a una determinada distribución teórica dada. 


H, =Los datos de la muestra provienen de una distribución teórica dada. 

Н |-іов datos de la muestra no provienen de una distribución teórica dada. 
Nivel de significación para la prueba=0.01; 0.05; 0.1 

Ejemplo 


Probar con un nivel de significación del 5% que las edades de los usuarios que 
concurren a un centro de información no se ajusta a una distribución normal. 


Edades о, р, е, = пр, |(о,-е)7е, 
18-22 12 0.0951 9.51 0.65195584 
22-26 16 0.1692 16.92 0.05002364 
26-30 23 0.2357 23.57 0.01378447 
30-34 24 0.2611 26.11 0.17051321 
34-38 15 0.1566 15.66 0.02781609 
38-42 10 0.0823 8.23 0.38066829 
Total 100 1 100 129476154 


н,=105 datos de la muestra provienen de una distribución Normal 

1,=Los datos de la muestra no provienen de una distribución Normal. 

Para estimar los p,, se deben estimar dos parámetros, la media y varianza de 
la población. 


Un estimador para la media y varianza poblacional, es la media y varianza 
muestral, de la tabla la media muestral para datos agrupados es: 29.76 y la 
varianza muestral es 35.3357576. 


p, =P(x<22)=P 2 e ) = P(z <1.31) = 0.0951 
5.94438875 5.94438875 


р, = Р(22 < x < 26) = 0.1692 
р, = Р(26 < x < 30) = 0.2357 
р, = Р(30 < х < 34) = 0.2611 
р; = Р(34 < х < 38) = 0.1566 
р, = Р(х >38) = 0.0823 
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Las frecuencias esperadas son: 


e, = пр, -100%0.0951-9.51 

e, =np, =100*0.1692=16.92 

е, =np, -100%0.2357- 23.57 

e, = пр, =100*0.2611=26.11 

е; = пр; =100*0.1566 =15.66 

es = пр; =100*0.0823 = 8.23 

Los resultados obtenidos se presentan en la tabla, luego el valor Chi-Cuadrado 


calculado es 
3 


_ 2 
х? = Ll 1.2947 
ігі е, 


і 


Valor que comparado con el valor tabular 
2 2224,2 La 232 _ 
X a-0.05;5-1-2) = Ж(0.5:6-1-2) = 4(0.95;3) 7 7.8147 


Decisión: 


Como el valor calculado con los datos de la muestra es menor que el valor 
tabular, entonces no rechazamos la hipótesis nula; es decir con los datos de la 
muestra y un nivel de significación del 5% las edades de los usuarios que 
concurren al centro de información se ajustan a la distribución normal. 


7.41. Prueba de independencia de dos variables 


Se utiliza para probar la independencia entre dos variables aleatorias de interés 
de una población estadística. Las variables se encuentran clasificadas en 
clases o categorías y lo que se trata es probar si las clases de la primera 
variable clasificadas son independientes de las clases de la segunda variable. 


La hipótesis a probar 


H, =Las variables en estudios son independientes no están asociadas. 
H, = Las variables en estudios no son independientes, están asociadas. 
Nivel de significación para la prueba 

(O =0.01; 0.05; 0.1 


El estadístico de prueba: 


2 Ae | 
X = 92)? жарлық ~ Жа-ауе-усі / H Cierta 


l= ¿al 
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Y las frecuencias esperadas bajo el supuesto de independencia de las 


variables, se calcular por: 
_ (0,10) 


m = ИР; 
y у п 


Se cumple que: 


Probar con un nivel de significación de 0.05 las calificaciones de las tesis no es 
independiente del género o las calificaciones están asociadas al genero. 


Calificación 
de las 
Tesis 
Regular Bueno Excelente Total 
Género 
Varón 40(42.128) 60(60.851) 10(7.021) 110 
Mujer 50(47.872) 70(69.149) 5(7.979) 125 
Total 90 130 15 235 


Н =Las variables calificación de las tesis con el género son independientes. 


Н „= Las variables calificación de las tesis con el género no son 


independientes 


Nivel de significación para la prueba=0.05 


Las frecuencias esperadas se calculan bajo la hipótesis nula cierta de que 
ambas variables son independientes. 


ж 
е = Қасы = 42.128 
ж 

е, = E = 60.851 
15*110 

ең зы = 7.021 

е, =47.872 

€, = 69.149 

е, = 7.979 
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2 2 2 2 2 
(о,-е):  (40-42.128) (5-7.979 
я-УУ 20 Же Y _260065 


де о 42.128 С?“ 7,079 


Valor que comparado con el valor tabular 
2 2 2 
Жа-о5:2-уч3-1) = Ж(о..95;2) = 4(0.95;2) = 5.99146 


Decisión: 


Como el valor obtenido con los datos de la muestra es menor que el valor 
tabular, luego no rechazamos la hipótesis nula; es decir, las variables niveles 
de calificación y género son independientes. 


7.42. Prueba de homogeneidad de muestras 


Permite probar si los datos de dos o más muestras pertenecientes a 
poblaciones diferentes, tienen una distribución similar, es decir; son 
homogéneas según ciertas categorías o clases de interés. 


La hipótesis a probar 


Н =Los datos de las muestras provienen de una misma población. 


Н, - Los datos de las muestras provienen de diferentes poblaciones 


Niveles de significación para la prueba 


© =0.01; 0.05; 0.1 


El estadístico de prueba: 


k r 2 
2 (o, -е;) 2 А 
x=»), o 7 Квери /H, Cierta 


Ejemplo 


Probar con un nivel de significación del 0.05 que existen diferencias 
significativas en las preferencias de los marcas de jabones de tocador con los 
distritos de procedencia; en otras palabras se puede consideran que las tres 
muestras provienen de poblaciones diferentes. 


jabones de 
tocador Marca A Marca B Marca С Total 
Distritos 
Miraflores 20 15 40 75 
Barranco 18 30 32 80 
San Borja 22 18 45 85 
Total 60 63 117 240 
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Н = No existe diferencias en la preferencia en las tres marcas de jabones de 


tocador en los tres distritos; es decir las tres muestran provienen de una 
misma población para las categorías 


Н „= Existe diferencias en la preferencia en las tres marcas de jabones de 


Tocador en los tres distritos; es decir las tres muestran provienen de una 
misma población para las categorías 


Nivel de significación para la prueba=0.05 


Las frecuencias esperadas se calculan bajo la hipótesis nula cierta. 


* 
= =18.75 
240 
63*75 
ya =19.6875 
240 
ЕЗ 
e, = ‚з = 36.5625 
e, =20 
е» =21 
e, = 39 
ез = 21.25 
е, = 22.3125 
es, = 41.4375 


Los valores esperados se presentan en la siguiente tabla: 


jabones de 
tocador B с Total 
Distritos 
Miraflores 18.75 19.6875 36.5625 75 
Barranco 20 21 39 80 
San Borja 21.25 22.3125 41.4375 85 
Total 60 63 117 240 
Calculo del valor Chi-cuadrado calculado 
3 3 = 2 с 2 _ 2 
Y m SNS (о,-е,)” (20-18.75) іш (45-41.4375)" _ 8.0023 


18.75 


Valor que comparado con el valor tabular 


2 2 2 
Ж (1-0.05;(3-1)<(3-1) = 4(0..95:4) = X(0.95:4) 7 9.4877 


41.4375 
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Decisión: 


Como el valor obtenidos con los datos de la muestra es menor que el valor 
tabular, no rechazamos hipótesis nula; es decir con un nivel de significación del 
5% y los datos de la muestra al azar, las preferencias a las tres marcas de 
jabones de tocador en los tres distritos provienen de una misma población. 


7.43. Prueba de homogeneidad de varianzas poblacionales. 


Se utiliza para probar si dos o más poblaciones tienen la misma 
variabilidad; es decir varianzas homogéneas. Si presentan varianzas 
homogéneas permite el estudio comparativo de los promedios 
poblacionales, mediante el análisis de la varianza. 


La hipótesis a probar 


H,= Мо existe diferencias significativas entre las varianza 
poblacionales. 


Н „= Existe diferencias significativas entre las varianza poblacionales. 


Niveles de significación para la prueba 


© =0.01; 0.05; 0.1 


El estadístico de prueba: 


Y (п, 011682) -$ 0, -1М(52) 


2 
Y = С “а-г 


Siendo: 


К= número de muestras en estudios 
2 
S; = varianza de la i-ésima muestra 
S? j 
= varianza ponderadas. 
П; = tamaño de la i-ésima muestra. 


C= termino de corrección 


БЕ > 1 1 
 3(k-1)|&n, -1 « 
! s (п, —1) 


El término de corrección. 


La varianza Ponderada: 
k 


(1-08; 
52 жа Жі 


Na) 
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Ejemplo 


Probar con un nivel del 5% que las varianzas no son homogéneas 


Repetición Colegio A Colegio B 
1 12 14 
2 15 15 
3 14 12 
4 13 14 
5 12 13 


Las varianzas para cada muestra son: 


La varianza ponderada 
k 


S (n, -DS ж ж 
sE _(5—1)*1,7+(5—1)*1.3_ 


і a 1.5 
Y (n,-1) ш 
1-1 


Termino de corrección 


C=1+ | ПЕТ ЖЕ =1.125 
3(2-1) (4 4 4-4 


El numerador del Chi-cuadrado calculado: 


4* Ln(1.5) + 411(1.5) - 4* Ln(1.7) - 4* En(1.3) =0.07173 


„ _ 0.07173 


E -0.06376 
Ke = T125 


Valor obtenido de la tabla 


2 2 2 
Xa-0.05;2-) = Ж(о.95;1) = (0.95; 1) = 3.841 


Decisión: 


Como el valor obtenidos con los datos de la muestra es menor que el valor 
obtenido de la tabla, aceptamos la hipótesis nula; es decir, 


poblacionales son homogéneas. 


7.44. Ejemplo propuestos 


1. 


Realizar una prueba de bondad de ajuste para verificar que los datos que 
se presenta en la tabla se aproxima a una distribución normal. Use un 


nivel de significación del 5%. 


Estaturas de Frecuencias 
alumnos (mts) | Observadas 
1.50-1.56 10 
1.56-1.62 18 
1.62-1.68 23 
1.68-1.74 22 
1.74-1.80 18 
1.80-1.86 9 

Total 100 


Una empresa desea estudiar, si existe dependencia entre los niveles de 
ingresos de 100 trabajadores y el tiempo de experiencia en la empresa. 
La información se presenta en la siguiente tabla. Use un nivel de 
significación del 5%. 


Niveles de Tiempo de experiencias (años) 
шы 0-5 5-10 | 10-15 | 15-20 
Вајо 4 11 9 14 
Medio 12 9 8 4 
Alto 10 6 7 6 
Total 26 26 24 24 


Dos investigadores toman muestras de diferentes ciudades con el objeto 
de estudiar los niveles de ingreso. Use un nivel de significación del 5%, 
para probar que las dos muestras provienen de una misma población. Los 
datos se presentan en la siguiente tabla. 


Niveles de ingresos (S/.) Total 

Ciudades 500-800 | 800-130 | 1300-1600 
A 150 100 20 270 
B 150 80 30 260 
Total 300 180 50 530 


Se eligen al azar tres diferentes colegio de Lima Metropolitana y se toma 
una misma prueba de control de lectura; los resultados de la calificación 
se presentan en la tabla que se adjunta. Probar con un nivel de 
significación del 5% de que las varianzas de las calificaciones no son 
homogéneas. 


Colegio A | Colegio B | Colegio С 
12 14 12 
15 10 11 
10 12 11 
9 14 12 
12 13 13 
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Se desea probar con un nivel de significación del 


5%, que las 


publicaciones de revistas científicas en español, inglés y portugués no 
están en la proporción 1:3:2; una muestra aleatoria de 320 revistas 
científica proporciona la siguiente información. 


Idiomas de la Frecuencias 
revistas científicas | observadas 
Español 51 
Inglés 168 
Portugués 101 
Total 320 
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CAPITULO 8 


8.1. Variables bidimensionales 


En esta capitulo se estudia a las variables bidimensionales, las cuales se 
presentan cuando se observan en forma simultánea dos variables (х;у) en la 


unidad elemental, en una población o muestra aleatoria. 


8.2. Tabla de doble entrada o contingencia 


Es una tabla en la cual se registran la cantidad de elementos de la muestra o 
poblacion que pertenecen a dos características simultáneas de las 
clasificaciones de las variable X e Y. 


Ejemplos: 


. Estatura y peso de los alumnos de la Universidad Nacional Mayor de San 
Marcos 

. Genero y Opinión de los encuestados 

. Número de heridos y causas de los accidentes de transito 

. Gasto e ingreso de los jefes de familia 

. Grado de instrucción y adaptabilidad al matrimonio de los cónyuges 

. Número de personas y cantidad de habitaciones en una casa 


Las variables bidimensionales (Х,У) pueden ser ambas cualitativas о 


cuantitativas o bien una mezcla de ambas. Cualquiera que sea el caso los 
datos se clasifican bajo dos criterios y se presentan en tabla de doble entrada o 
tabla de contingencia. 


Supongamos que la variable X se clasifica en “т” clases y la variable Y en “К” 
clases. Cada Л» nos indica el número de veces que la unidad elemental 


presenta la clase Ж, е Y, simultáneamente, obteniéndose de esta forma una 
distribución conjunta de las variables X e Y. Ver tabla 01 


Tabla 01 


E 


Total 


X 
Х, Л Л» ЖЕКЕН: Л. 
X, Л Л» Lo h 


X n Ím Sn | Sa | Sa 
Ton Л, fa МЕР /. 
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Ejemplo 


Una muestra elegida al azar de 98 tesis de la especialidad en economía, se 
observó simultáneamente dos variables de interés. 
Х = Género del autor de la tesis (varón, mujer) 

Y = Calificativo en la sustentación (excelente, muy bueno, bueno, regular). 


Los resultados se presentan en la tabla 02: 


Tabla 02 


Género del autor (X) y calificativo en la sustentación (Y) de 98 tesis en la 


especialidad de economía. 


Calificativo (Y) 


Género (X) ¡Excelente ы Виепо Regular Total 
Varón 8 12 15 12 47 
Mujer 6 10 20 15 51 
Total 14 22 35 27 98 


Fuente: Biblioteca Central de la Universidad Nacional Mayor de San Marcos 


Interpretación: 


Уй =8 (Significa del total de la muestra, 8 tesis sustentadas corresponden a 
varones y obtuvieron el calificativo de excelente). 


f. =47 (Significa del total de la muestra, 47 tesis sustentadas corresponden a 


varones). 


S. 2 =14(Significa del total de la muestra, 14 tesis sustentadas corresponden al 
calificativo excelente). 


Gráfica: Género y calificativo de 98 tesis sustentadas en economía. 


40 


35 


30 
25 


Excelente 


Muy bueno Bueno 


mVaron вш Mujer 


Regular 
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La Tabla 02, también puede presentarse por sus frecuencias relativas para 
cada casillero. 


Tabla 03 


Género del autor (X) y calificativo en la sustentación (Y) de 98 tesis en la 
especialidad de economía, expresado en porcentaje. 


Calificativo 
Género Excelente | Muy bueno Bueno | Regular | Total 
Varón 8.16% 12.24% 15.31% | 12.24% 47.96% 
Mujer 6.12% 10.20% 20.41% | 15.31% 52.04% 
Total 14.29% 22.45% 35.71% | 27.55% | 100.00% 


Fuente: Biblioteca Central de la Universidad Nacional Mayor de San Marcos 


Interpretación: Del total de la muestra (98 tesis), 8.16% de las tesis 
corresponden a varones y obtuvieron el calificativo de excelente. 


Tabla 04 


Presentación de la tabla 02 por fila 


Calificativo 
Género Excelente | Muy bueno | Bueno | Regular Total 
Varón 17.02% 25.53%) 31.91%| 25.53% 100.00% 
Mujer 11.76% 19.61%| 39.22% | 29.41% 100.00% 


Fuente: Biblioteca Central de la Universidad Nacional Mayor de San Marcos 


Interpretación: del total de las tesis sustentadas por varones (47), 17.02% de 
las tesis recibieron el calificativo de excelente. 


Del total de las tesis sustentadas por varones (47), 25.53% de las tesis 
recibieron el calificativo muy bueno. 


Tabla 05 


Presentación de la tabla 02 por columna 


Calificativo 
Genero Excelente | Muy bueno | Bueno | Regular 
Varón 57.14% 54.55%  42.86%| 44.44% 
Mujer 42.86% 45.45% | 57.14%| 55.56% 
Total 100.00% 100.00% | 100.00%| 100.00% 
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Interpretación: del total de las tesis sustentadas que recibieron el calificativo de 
excelente (14); 57.14% corresponde a varones. 


Del total de las tesis sustentadas que recibieron el calificativo de excelente 
(14); 42-86% corresponde a mujeres. 


De la tabla 01: 


Í., se llaman frecuencias marginales para la variable У, se representa por: 
= РОХ = х) 
/, ‚ se llaman frecuencias marginales para la variable Х, se representa por: 


¿SUPE 


8.3. Independencia estadística 


Se dice que dos variables X e Y, son independientes estadísticamente, 
cuando las frecuencias relativas conjuntas son igual al producto de las 
frecuencias relativas marginales para todas las celdas de la tabla 01; es decir, 


Lu Lists 


n n n 


V, 


y 


Si esta condición no se cumple para todas las celdas, se dice que hay 
dependencia estadística. 


8.4. Medias y Varianzas Marginales: 


Supongamos que en la tabla 1, ambas variables (X,Y) son cuantitativas, Las 
medias y varianzas marginales de X e Y , son dadas por: 


k k _ 

ХЮ. СЕКА 
х — i=l 52 — i=l 

n * п 
k ғ == 

>], ОЈ) 
To dal 2, ii 
r n Е п 

LE i = 1,2,3,...k 
1 Я n= [ . 

Siendo: 2, el Л» j= 1,2,3, r 
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8.5. Covarianza (X,Y) 


Es el estudio de la variabilidad conjunta de dos variables aleatoria (X,Y), la 
medida que se utiliza para cuantificar esta relación es: 


k 


EE-D- Уло пау 


Sy = Соух, у) = =E == 


Si >0> Hay dependencia lineal directa (positiva); es decir a grandes 
valores de X , corresponden grandes valores de У. 

ds -0->Мо hay dependencia lineal entre las variables (están 
incorrelacionadas); es decir no hay relación lineal 

5, <0—› Hay dependencia lineal inversa o negativa; es decir a grandes 


valores de X , corresponden pequeños valores de У. 


8.6. Propiedades de la Covarianza 


a. Si a todos los valores de la variable X e Y , les sumamos un valor 


constante k; Іа covarianza original no cambia. 
b. Si atodos los valores de la variable (X,Y), les multiplicamos por una 


constante (k, у k,), respectivamente, la covarianza original queda 
multiplicada por el producto de las constantes. 


с. Sea S la covarianza de la variable bidimensional X е Y , sean las 


xy > 


transformaciones lineales para cada variable Z = ax +b ,w=cy+d la 


nueva covarianza es dada por: $., = ací, 


8.7. COEFICIENTE DE CORRELACIÓN LINEAL DE X E Y 


El inconveniente de la covarianza, como medida de asociación es su 
dependencia de las unidades de medidas que utiliza. Para salvar esta 
dificultad, se define otra medida de la asociación como la correlación, que no 
está afectada por las unidades de medidas. 


ЭЕ Соу(х, у) 
я 5..5, 
Ejemplo aplicativo 
Se toma una muestra al azar de 22 jefes de familias y se registran dos 


características de interés X= М? de hijos y Ү-М? de dormitorios, los datos se 
presentan en la tabla 01. 
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1. 


Tabla 01 


Familia | № Hijos=x 


Habitaciones=y 


оо моол шом e 


hb 
o 


ғ 
ғ 


ғ 
N 


ps 
о 


ғ 
> 


ғ 
іл 


ғ 
о 


ғ 
ч 


m. 
00 


к 
[Co] 


N 
o 


N 
ғ 


N 
N 


ос шю ш мімімімімімімімімімімінікікікікік(ке 


ьо јо моо шо моо Боом мојом њм Je 


Elaborar Іа tabla de distribución de frecuencias de X e Y, 


presenta en la tabla 02. 


los resultados se 


Tabla 02 
Habitaciones=y 
№ Hijos=x 1 2 3 4 Total 
1 2 4 1 0 7 
2 0 2 6 2 10 
3 0 0 1 4 5 
Total 2 6 8 6 22 


De la tabla 02. Hallar las distribuciones marginales de X e Y 


Distribución marginal de X 


Tabla 03 
X Ж 
1 7 
2 10 
3 5 
Total 22 
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Distribución marginal de Y 


Tabla 04 
Y Í; 
1 2 
2 6 
3 8 
4 6 
Total 22 
Distribución condicional de Y dado X=1 
Tabla 05 
Y fO/X =1) 
1 2 
2 4 
3 1 
4 (0) 
Total 7 


De la tabla 02. Calcular la media marginal de X 
k 
xfi 
Ha 7107) + 2(10) + 3(5) 


i= 


22 22 


= 1.909091 


De la tabla 02. Calcular la Media marginar de Y 
k 


Е 2 ПА _1(2)+2(6) +3(8) + 4(6) 


у= = 2.818182 
п 22 
De la tabla 02 calcular la variancia marginal ае X 
3 
4. А Ох) 
(х, = х)? S, at =*5— 
2 > _ 2, I 
= п-1 22-1 


(42)? 
22__ 0.562770562 


‚ 09"07)+0)?10+(3)°5 
= 21 


De la tabla 02 calcular la variancia marginal de Y 


4 
A _ А Qu) 
ZO, DE 

52 = і — sl 22 = 

7 п-1 22-1 

2 

@)°2+(2)°6-+(3)°8-+(4)°6 (62) 

S? = 5 22 0,917748917 
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Calcular la covarianza para la tabla 02 


Utilizando la fórmula de la covarianza, con los datos de la tabla 02 


2 SEÑA 
2, ху; Е 10x y 
Sy = Cov(x, y) = =A 


4 
=1 


10-1 


2(1)(1) + 4(1)(2) + ... + 4(4)(3) — е) 


? 21 
S,, = 0.554112554 


$ 


Calcular el coeficiente de correlación lineal de X e Y 


Utilizando la fórmula de la correlación y los cálculos obtenido anteriormente 


Sy _ 0.554112554 
S.S,  /0.562770562./0.917748917 


= 0.771028379 = 0.771 


r 
xy 


De otra forma de la tabla 01 


El coeficiente de correlación de Xe Y 


2 %2 xÈ y) 


Уху, AAA 130 _ (42X62) 
кос E 22 Б 22 
9 22 22 (42) (62): 
х) y? 9 үш 
2, 0, ) о, О») 22 22 


20 


і-і 


Уи 77-722 


т. = 0.771028379 = 0.771 
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8.8. Ejercicio propuestos: 


1. Elaborar una tabla de doble entrada con los datos que se presentan 
a continuación. 


Sexo V р |V р у р р р |V р |V р р р 


Candidato, A |C |В A |A |B A [В [А [A |C |A В А 


Sexo D IV |V р |V м р р |V |р D |V ID 


Candidato В |A В |A |A |В |A С |A |A |B |A А 


Con la información elaborar la tabla de doble entrada e interpretar algunos 
resultados. 


2. Los siguientes datos corresponden a una encuesta tomada a 56 
alumnos de la Universidad Nacional Mayor de San Marcos, con la 
finalidad de evaluar los servicios que prestan a los usuarios la 
biblioteca Central. 


Sexo V р |V |V |V |р |D |D |V р |V |D |р |р 


Servicio в R |B |R M |R IB М ÍR ІК Вв |B В |К 
Del CI 


Sexo V р |V |D |V |р р |D м |р |V |D |D |р 


Servicio|B |M R К В |B M Вв |M IR ІК Вв В в 
Del Cl 


Sexo Ур |V р |V р р |D |V D |V |D |D |р 


Servicio |R |B К К B |R RR B |R КОВ R м IR 
Del CI 


Sexo У р |V р |V р р |D V |р |V |D |D |р 


Servicio|B |B |B |M в |B м в в R м в в М 
Del CI 


LEYENDA 

Género: V = VARON M= MUJER 

Servicios del CI (Centro de Información): M=MALO R=REGULAR 
B= BUENO 


Con la información elaborar la tabla de doble entrada e interpretar algunos 
resultados. 
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CAPITULO 9 


ANÁLISIS DE REGRESIÓN Y CORRELACION SIMPLE 


9.1. Regresión lineal simple 


Estudia la relación funcional entre dos variables, una de ellas llamada 
dependiente o respuesta (Y) y otra variable independiente o predictora (X), de 
tal forma que la primera (Y) depende de la segunda (X), o dicho de otra forma 
X influye en el comportamiento de Y; el objetivo de estudiar esta relación son: 


e Identificar la variable X que influye en Y, a través de cierta literatura 
científica. 

e Modelar a través de una función matemática que mejor se ajuste a la 
nube de puntos. 

e Predecir o estimar la media de Y, dado un valor de X de interés 


Ejemplo (1) 


Y = gastos mensuales de las familias 
X = ingresos mensuales de las familias 


Para estas dos variables, los gastos de las familias dependen de los ingresos, 
matemáticamente se expresa por: Y = f(X) 


Ejemplo (2) 


Y = utilidad mensual de una empresa Ү= /ҒОО 
X = gasto mensual en publicidad 


Para el ejemplo (1) 


gastos 


ingresos 


La nube de puntos se representa a través del modelo estadístico 


Y =P, +PX+e 
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Se puede escribir 
Ү= Р(Х) += 


ГОХ) = В, + $, X, es parte lineal, la que se supone contiene toda Іа información 


de Y, y e, es la parte aleatoria, la que se supone contiene la mínima 
información de Y, también se le atribuye a otras variables independientes no 
consideradas en el modelo. Se supone que los errores tienen una distribución 
normal no están correlacionados entre ellos y tiene media igual a cero 0 y 
variancia constante igual a o°. 


9.2. Supuestos del modelo 


a. Los valores que toma X son fijados por el investigador, de acuerdo а 
la literatura científica a fin de explicar el comportamiento de la 
variable Y. 

b. Рага cada valor de Х, fijo, se genera una distribución de valores 


para Y que tienen una distribución Normal con media y varianza, 
dada por: 


У«М(ш-ЕҮ/Х-х) ; о) 


с. La diferencia entre un valor cualquiera Y, y su media E(Y/X) se le 
llama error, es decir: 


e, =Y,-E(Y/X) 


Y, =EY/X)+e8, 


Si suponemos рага la media E(Y/x,) es una línea recta, es decir que una 
recta pase por todos los puntos, luego: 


ХО) = Е(Ү /x,)= В, + P,x, 


Lo anterior es llamado la ecuación de regresión lineal poblacional de Y sobre X 
В,, es el intercepto con el eje Y 


В, es la pendiente de la recta, se interpreta como el incremento promedio de Y 
ante un incremento unitario en X. 
Los coeficientes 2) у д, se le llama parámetros del modelo y van a ser 


estimados con los datos (X,Y) de la muestra aleatoria, al igual que a la 
variancia constante o? 


Luego: 


Y; = Po ДАЕ, (1) 
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9.3. Estimación del modelo de regresión 


La» 


Para estimar el modelo (1) se extrae una muestra aleatoria de tamaño “п” y se 
registra los valores de los pares ordenados 


(ху) (2, У). (Xn Yn), 


Con estos pares ordenados planteamos la función de regresión lineal muestral 
dada por (2), la que estima a la función de regresión poblacional, es decir: 


y, =b +b,x, +e, (2) 
La recta estimada es: 


Y =b, +b,x 
(8) 
(3) estima a la ecuación de regresión lineal poblacional de Y sobre X, es decir, 


ӯ > EY/x) 


Para estimar los coeficientes de la ecuación de regresión muestral dado por 
(2), se hará uso de la técnica de los mínimos cuadros ordinarios (МСО), 


técnica que consiste en calcular los valores de bọ у b, tal que minimice la 
suma de los cuadrados de los errores, es decir de (2), se tiene: 


Уе =) (y, -b -bx =f(b,,b,) 
і-і і-і 


Para obtener los valores que minimiza la función  f(»,,b) Яегіуатоѕ 
parcialmente con respecto a b, y b, eigualamos a cero; es decir: 


Of (b,,b,) = 0 


ды, > Бо=у- |х 
У 00,0) 
IN g _ SP(x,y) 
Ob, У, xy SC(x) 


Ejemplo 


Con la finalidad de estudiar la relación funcional entre los niveles de ingresos y 
gastos mensuales de las familias, se toma una muestra aleatoria de 7 familias, 
los resultados expresados en cientos de nuevos soles se presenta en la 
siguiente tabla: 
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Observación 1 2 3 4 5 6 7 
Ingresos(X) 5.2 5.5 5.8 6.4 7.0 7.4 8.2 
Gastos(Y) 4.9 5.0 5.4 5.8 6.2 7.0 7.8 


Con la información dada: 


a) Estime la ecuación de regresión lineal de Y sobre X, interprete los 
coeficientes: 


Para calcular los coeficientes de la recta estimada se debe calcular las 


siguiente sumatorias 
7 7 7. 7 
Ух, =4550 Уу =4210 $ xy, =280.58 У х2 =302.89 
і-і і-і і-і i=l 
7 


y? =260.09 


і-і 
Usando la formula ве tiene: 


Ух, DO, 20) 


b — i=l _ SP(x,y) 
1 n 
Ух, =x)? т 
i=l 
А қ 2 
Уху, -пх у 280.58- 7* 123074210 
Ь = 11 = 7*7___—(97059 


1 


ЕТЕНЕ 45.50 › 
Y xj -na 302.897. 
і-і 


b,=y-b,x= 29 — 0.97059 * sa --0.29455 


Luego la recta de regresión estimada de y sobre х es: 
у=} +b,x =-0.29455+0.97059x 


-0.29455: el intercepto nos indica que cuando el ingreso es cero, no existe 
consumo. Si este valor fuese positivo nos indicaría que cuando el ingreso es 
cero el gasto promedio seria de S/. 29.455 que lo realizaría, por decir vía 
préstamo. 


0.97059: la pendiente nos indica que cuando el ingreso se incrementa en 
un nuevo sol, los gastos se incrementan en promedio en S/ 0.97059. 


b) Se desea estimar el gasto promedio mensual para un nivel de ingreso 
mensual de S/.800.00. 
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En la ecuación de regresión estimada remplazamos el valor de S/.8.0, 
se tiene: 


9 =-0.29455+0.97059(8.0) = 7.47017 


Interpretación: cuando el ingreso es de 5/. 800, se estima un gasto 
promedio mensual de S/. 747.017 


с) Estime el 4, residual: 


De (2) se tiene: 


Y, = bo +b,x, + €, 
Remplazando los valores se tiene: 
5.8 =-0.29455 + 0.97059*6.4+е, Luego: е, =-0.11723 


Indica que el gasto observado es menor al gasto estimado en 0.11723. 

el error estimado puede ser positivo: cuando el valor observado de la 
variable dependiente o respuesta es superior al valor estimado, es 
negativo cuando el valor observado es inferior al valor estimado, y cero 
cuando el valor observado esta sobre la recta estimada. 


9.4. Propiedades de los errores estimados: 


п 
a. Los errores estimados es сего. Уе =0 
і-і 
El punto promedio muestral (х, y) esta sobre la recta estimada 
с. La suma de los cuadrados de los errores es mínima. 


ye =es minimo 


9.5. Análisis de la varianza (ANOVA) para una regresión lineal simple 
estimada. 


Es la descomposición de la fuente de variación total de la variable dependiente 
en dos fuentes, la primera atribuible al modelo estimado y la segunda debido al 
error, y nos permite probar la siguiente hipótesis: 


Н,: В, =0 Indica que X no influye en Y 
H,:PB,+0 Indica que X influye en Y 
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Para un nivel de significación 
а = 0.05 = Plrechazar H,/H, cierta) 


Del modelo (2) 
у; = Do + Бах; + е;, тетріагапдо por 


5 =y-b,x 

se tiene: 

y; = y —b,x+b,x, же; 

y, y =b/(x,-x)+e, (3) 


(3) elevando al cuadrado ambos miembros, aplicando sumatorias y 
simplificando se tiene: 


Y O,-»Y = ВУ (х,—х)°* + Уе? 
і-і i=l і=1 


абпае: 


>; — у)? = suma de cuadrados total = SC(total) 
i=l 


b’, (х, — х)? = suma de cuadrados debido a la regresión = SC(Re g) 


i=l 


>. е? =suma de cuadrados debido al error = SC(error) 
і=1 


Definimos a los Cuadrados Medios СМ, рог: 


SC(regresion) 
1 


CM(Regresión)= 


SC(error) 
CM(error)= кыла 


La razón de ambos cuadrados medios se distribuye como una variable “F”. es 
decir: 
СМ (regresion А 
Е = Сира) = Fan- / H, es cierta. 
CM (error) i 


Los resultados anteriores se presentan en un cuadro llamado Cuadro del 
Análisis de Varianza (ANOVA): 
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Cuadro de análisis de la varianza (ANOVA) 


Fuentes de Grados de Sumas de Cuadrados F calculado 
variación libertad ( gl). | cuadrados (SC). medios (CM) 
(FV) 
Regresión 1 SC(Regresión) | СМ(Кедгеѕібп) | CM (regresión) 
Error N-2 SC(Error) CM(Error) CM (error) 
Total N-1 sC(Total) 
De la tabla se rechaza la hipótesis planteada si: 
ар > Fa-arn-Del 
d. ¿ Hay relación lineal entre X e Y. Use un nivel de significación 5%. 
Debemos probar la siguiente hipótesis: 
7 
2 
, Б Су) 
sCítotal) = Y (y, y)? =У у? = = 6.8886 
і-і ігі 
ч 2 
КЕРЕ 
SC( Regresión )= 22У (x,-x)? =b Ox? – = ла. = 6.7262 
і=1 і=1 
SC(Error )= SC (Total) -SC (Regresión) = 6.8886 - 6.7262 = 0.1624 
Estos resultados son presentados en la siguiente cuadro del ANVA 
FV GL. 5С. СМ ЕС 
REGRESION 1 6.7262 6.7262 207.09 
ERROR 0.1624 0.0325 
TOTAL 6 6.8886 


De la tabla el valor tabular es: Хз. 5) = 6.61, como el valor calculado es 


superior al valor tabular, existe evidencia estadística para rechazar la hipótesis 
nula a un nivel de significación del 5%, luego la variable ingreso de las familiar 
influye en sus gastos. 


9.6. Coeficiente de determinación ( R°) 


Es una medida que nos indica la proporción o porcentaje de la variación total 
de la variable dependiente Y , explicada por el modelo de regresión estimado. 


169 


Tiene Por fórmula: 
R=- SC(regresión) 
SC(total) 


x100% 


para nuestro ejemplo, se tiene: 


2 _ 6.72620 


= x100% = 97.64% 
0.16237 


Interpretación: nos indica que el 97,64% de la variación en los gastos 
mensuales, es explicada por el modelo estimado. 


9.7. Variación no explicada por el modelo de regresión estimado 


100% – А = 872920 100% = 100.0% – 97.6% = 2.4%, , de la variación 


en los niveles de gastos, no es explicada рог el modelo estimado. 
Ejercicio 


La utilidad( S/.) diaria (Y) de una empresa dedicada a la confección de 
pantalones, depende de la cantidad (X) de pantalones (en cientos) que 
confecciona. Una muestra aleatoria de 8 días arroja la siguiente información. 


X 2.0 3.5 5.0 6.5 8.0 10.5 13.0 14.0 
Y 250 400 800 850 1000 1100 1200 1500 
1. Estime la ecuación de regresión lineal de Y sobre X., e interprete los 


coeficientes. 

Hallar el cuarto residual. 

Estime la utilidad futura para el décimo día. 

Hallar e interprete el coeficiente de determinación. 

Hallar e interprete la variación no explicada por el modelo de 
regresión. 


оһоһм 


9.8. Intervalo de confianza (1-а)100% para la pendiente de la recta de 


regresion poblacional £, 


2 


Suponiendo la distribución de los errores tales сото: є, ~ N(0 ; с”) 


Entonces: У -=NM(B,+B,X, ; о?) 
2 
También se cumple que: b ~ МД, ; +) 


> ш х)? 


Un estimador insesgado рага la varianza de los errores с”, es dado por еі 
cuadrado medio de error obtenido del cuadro del АМУА; es decir: 
CME(Error) > 0? 
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Por desconocer la varianza poblacional de los errores ос”, para construir un 
intervalo de confianza de (1-а)100% рага el parámetro /,, usamos la 
distribución T-Student 


ME ¿sa ME ) ja 


PY (1) 2 (ху 


i=1 і-і 


Conf (b, -t 


Ejemplo-1 


Utilizando los datos del cuadro —1, construir un intervalo de confianza del 95% 
para la pendiente poblacional д, 


1-a =0.95 > a =0.05 > Тоо, = Тоо =2.57058 
ar 
2 


b, = 0.97059 
СМ(Е) = 0.0325 


SC(X) = У = х)? =7.14 


Utilizando la formula anterior se tiene: 


0:0323 < В, < 0.97059 + 2.57058. 00323 
7.14 7.14 


Conf (0.97059 – 2.57058 ) = 0.95 


Conf (0.79716 < В, <1.14402) = 0.95 
Interpretación: Existe una confianza del 95% de дие е! intervalo 


(0.79716;1.14402) contenga al verdadero valor del coeficiente de la pendiente 
poblacional de la recta de Regresión. 


9.9. Análisis de correlación simple 


El análisis de correlación simple, es el estudio del grado de asociación o 
relación existente entre dos variables aleatorias y esto se realiza en base a la 
observación simultánea de dos variables en cada unidad elemental de una 
muestra aleatoria, el objetivo ев averiguar si el comportamiento de una 
variable está asociado al comportamiento de la otra variable. 

Por ser amabas variables aleatorias su variación genera una distribución 
probabilística conocida como distribución bivariada. 


El valor numérico o indicador del grado de asociación existente entre las 
variables aleatorias X e Y, se le llama coeficiente de correlación simple; este 


se define en la población como: 
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Е(Х-шХҮ-м,)| 
EX -uP er-u} 


() 


El valor que toma este coeficiente varía en el intervalo —1 < p < +1 
e  p=l nos indica que existe una asociación o correlación perfecta positiva; 
es decir si X aumenta Y también aumenta. 


e (--іІ, nos indica que existe una asociación o correlación perfecta 


negativa; es decir si X aumenta Y disminuye y viceversa. 


La ventaja del coeficiente de correlación (su valor) es independiente de las 
unidades de medidas en que se expresan los valores de las variables X eY. 


9.10. Análisis de correlación lineal simple. 


Es una caso particular del análisis de correlación simple, donde se asume que 
existe una relación del tipo lineal entre las variable X e Y. 


9.11. Supuestos 


. Las variables X e Y son aleatorias 
. Las variables Х e Y tienen distribuciones normales 
. Existe una relación lineal entre las variables X e Y 


бі se toma una muestra aleatoria de tamaño “n” de datos bivariados (x,, у,), 


correspondiente a las variables х e y; luego un estimador del parámetro /2 
llamado, el coeficiente de correlación lineal muestral es: 


Ya DO, -7) VAN =p 


Y qx, =xy Zo, = у)? E -nx Y y; -ny 


El valor que toma este coeficiente varía en el intervalo — 1 < r < +1 


22 8Р(Х,Ү) es 
SCX) SCO) 


r 


1. r= +1 nos indica que existe una asociación o correlación perfecta 
positiva; es decir si “X” aumenta “Y” también aumenta; en otras palabras 
todos los puntos están sobre una línea recta de pendiente positiva. 

2. r= —1, nos indica que existe una asociación o correlación perfecta 
negativa; es decir si “X” aumenta “Y” disminuye y viceversa; en otras 


palabras todos los puntos están sobre una línea recta de pendiente 
negativa. 


3. r= 0, nos indica de que no existe relación lineal entre las variables 
X e Y ; esto no implica que las variables X e Y sean independientes. 


172 


r=-+l 


10 У 


11 12 13 14 15 16 17 18 


1.0 
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г = 0.997 


3 
| 
. 


м ом о о -4 о о 
| 


r = 0.802 


9.12. Prueba de hipótesis para el coeficiente de correlación lineal 


El valor del coeficiente de correlación lineal simple, no es suficiente para 
evaluar el grado de asociación existente entre la variable X y la variable Y. En 
estos casos es conveniente averiguar, sobre la base de las evidencia de la 
muestra, si el coeficiente de correlación lineal simple de la muestra cumple 
alguna condición establecida en una hipótesis. El Y de Pearson es una 
estimación del coeficiente de correlación de la poblacion О. La prueba de 
hipótesis nos permite decidir si el coeficiente de correlación poblacional es cero 
o diferente de cero (la prueba es significativa). La decisión se toma en base a 
coeficiente de Pearson calculado Y y del tamaño de la muestra M. 


Н: p =0 > (№ hay correlacion lineal entre X e Y) 
H: о +0  ( hay correlacion lineal entre X e Y) 
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Nivel de significación а = P(rechazar Н,/ Н, cierta) 
El estadístico de prueba es: 

ғ-р 
t, == TE ы Т., хы 

l-r“ 

n-2 
Región de rechazo de la hipótesis nula. 

<Т ї„>Т 
5ї б с) о й 2) 


NOTA 


Si se acepta Ho entonces nos indica que las evidencias muestra 
expresan que no existe una correlación significativa entre las variables 
X e Y. El no rechazo de hipótesis nula no implica que las variables X e Y 


sean independientes. 


Al rechazar la hipótesis nula, indicará que las evidencias muestral 
expresan que existe una correlación significativa entre las variables. 
Debe tenerse presente que el rechazo de hipótesis nula no implica que 
la relación funcional entre las variables en estudio sea necesariamente 
una función lineal, se recomienda graficar la dispersión de los datos, 


para estudiar el tipo de relación funcional entre las variables. 


Ejemplo 
X 23 24 25 26 27 28 
Y 50 55 56 60 58 65 


Probar si existe una correlación significativa entre las variables X e Y. 


Use а = 0.05 


Н,:р= 0 > (No hay correlacion lineal entre X e Y) 


H,:p0-> (лау correlacion lineal entre X e Y) 


а-0.05 


Usando la formula dada en (2) se tiene que r = 0.932 


Calculo del estadístico de prueba 
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r=p _ 0932-0 
l-r? |1—0.9322 
n-2 6—2 


5.14297 


Región critica para la prueba, como la prueba es bilateral se tiene, que 
se rechaza la hipótesis planteada si: 


Ts 206 0 ST =2.776 


(0.975;4) 


Como 1, = 5.14297 , entonces se rechaza la hipótesis nula. La prueba 


es significativa el coeficiente de correlación poblacional no es cero. Hay 
prueba suficiente para concluir que existe una relación lineal significativa 
entre la variable X y la variable Y. Existe una relación lineal significativa 
entre la X y la Y. Podemos utilizar la línea de regresion para modelar la 
relación lineal entre la variable X y la variable Y en la poblacion. 


Gráfica de distribución 
Т; df=4 
0.4 


0.3 


0.2 


Densidad 


0.1 


0.025 0.025 
0.0 


-2.776 


o 


2.776 


9.13. Ejercicio propuesto 


La siguiente tabla corresponde a los ingresos y gastos por consumo ( en 
cientos de nuevos soles) de 7 familias elegidas al azar. 


observación 1 2 3 4 5 6 7 
Ingresos(X) 5.2 5.5 5.8 6.4 7.0 7.4 8.2 
Gastos(Y) 4.9 5.0 5.4 5.8 6.2 7.0 7.8 


Hallar el coeficiente de correlación. 


Probar si existe una correlación significativa entre las variables X e Y. 
Use a=0.05 . 
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9.14. Coeficiente de correlación de rangos de Spearman 


Su valor mide la asociación entre los valores de las dos variables X e Y ,se 
usa cuando por lo menos unas de las variables es ordinal, y no se cumple los 
supuestos de normalidad bivariada, tiene por fórmula: 


6) (Rx, – Ку) 
A (1) 
| n(n? —1) 


(Rx, – Ку,) =Diferencias de los rangos de las variables Х е Y 
Para una muestra de tamaño л, se tiene (x,,y,), los valores que toman la 
variables X e Y se orden en forman descendente o descendentes sus 


rangos, en caso de que existan empates en su valor se calcula su promedio. 
La interpretación que del valor de r, es la misma que la del coeficiente de 


Pearson. 


La fórmula anterior se usa cuando no hay empates en los rangos (orden), de lo 
contrario se usa la fórmula más general. 


п 


DSR- 24%, =R,y 


r = (2) 
| DIRE a ГЕ 
Donde 
g 
2 
n А n(n? -1) ELE, -1) 
УК == -M, Mm. .= —— 
i=l Е 12 12 
У 2 
E(E?-1) 
ув SE ж ы Y М,- ial 
; i 12 


М, =Es el término de corrección por empates en los rangos de х 
М, =Es el termino de corrección por empates en los rangos de y 


Supongamos que no hay empates en ambas variables la formula (2) se 
convierte en (1) 


Ejemplo 


Dos jurados evalúan a 12 candidatos para un puesto de trabajo, la calificación 
es de 0 a 20. Los datos se presentan en la tabla. 
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Postulante | X=Jurado ше Rx, Ry, (Rx, – Ку,) | (Кх, —Ry,) 
A 

1 12(1) am 1.5 2.5 -1 1 

2 14(4) 14(2) 4 2.5 1.5 2.25 

3 15(6) 14(3) 6 25 3.5 12.25 

4 13(3) 15(5) 3 6 3 9 

5 17(9) 16(8) 9.5 8.5 1 1 

6 17(10) 18(12) 9.5 12 -2.5 6.25 

7 16(8) 15(6) 8 6 2 4 

8 15(5) 17(10) 6 10.5 -4.5 20.25 

9 19(12) 17(11) 12 10.5 1.5 2.25 

10 18(11) 15(7) 11 6 5 25 

11 15(7) 16(9) 6 8.5 -2.5 6.25 

12 12(2) 14(4) 1.5 2.5 -1 1 
total 90.5 


Aplicando la formula (2), calculamos los términos de corrección para x e y 
Para el rango de x: existe un grupo con 2 empates (g=1); otro grupo con 2 
empates (g=2) y un tercer grupo con 3 empates (g=3). 
Para el rango de y: existe un grupo con 4 empates (g=1); otro grupo con 3 
empates (g=2), un tercer grupo con 2 empates (g=3) y un cuarto grupo con 2 
empates (g=4). 

3 
ХЕКЕ? -)) 202° -1)+2(2? 1) +3(3° 1) 36 
І-і ЕНЕ == 


M, == 
12 12 12 


=3 


JEE? -1) 2 2 2 2 
4 A8 -1 +38? —1)+2(2° —1) +2(2? —1) _ 96 
И 12 12 12 


12 270. 
$ ga LUZ 3140 
12 


M =8 


2 
Ув = = = АДЕ A 8135 


Existe una Ж: са entre ambas calificaciones de los jurados 


_ 140+135-90.5 
2.41140.4/135 


Entre las variables X е Y existe una baja correlación o asociación. 


= 0.671020 


5 


Usando la formula (1) 


E | _1__600.5) 
n(n? —1) 12(12? -1) 


= 0.683566 (1) 
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Entre los valores que toma la variable X e Y existe una moderada correlación o 


asociación entre las opiniones de los jurados. 


Prueba de hipótesis 


H,:p=0>(Wo hay correlacion entre X e Y) 


H,:p*+0> (hay correlacion entre X e Y) 
Nivel de significación о = 0.05 


Se rechaza la hipótesis nula si el valor tabular cumple cualquiera de las 
siguientes condiciones: 


і. <Т 


ооздо) = 2.22814 LST 


(0.025:10) = 2.22814 


El estadístico de prueba es: 


E = 


_riin—=2 _0.6710204/12-2 
° i-r? 41-0.671020: 


Conclusión se rechaza la hipótesis nula, existe una correlación significativa 
directa entre las variables. 


= 2.862 


9.15. Ejercicio propuesto 


Para los datos de la tabla, calcular el coeficiente de correlación de rangos de 
Spearman entre el ciclo académico del estudiante y la opinión sobre los 


servicios de la biblioteca y probar su significación al 5% 


X=Ciclo Ү-Оріпібп sobre los 
№ асааётісо servicios la biblioteca 
1 8 3 
2 5 8 
3 8 9 
4 7 8 
5 4 7 
6 10 8 
7 6 8 
8 3 7 
9 1 7 
10 2 7 
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ANEXOS 


Las siguientes tablas estadísticas han sido obtenidas por el autor, mediante el 
paquete estadístico MINITAB Y MICROSOFT EXCEL 


1. NORMAL ESTANDAR 
2. T-STUDENTS 

3.  CHI-CUADRADO 

4.  F-SNEDECOR. 


5.  NUMERSOS ALEATORIOS 
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№ 1 


PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION NORMAL ESTANDAR 
(PARA VALORES POSITIVOS DE 2) 


2 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
0,00| 0,5000| 0,5040) 0,5080/ 0,55120| 0,5160 0,5199) 0,5239] 0,5279| 0,5319) 0,5359 
0,10| 0,5398| 0,5438 0,5478/ 0,5517 | 0,5557) 0,5596) 0,5636] 0,5675| 0,5714] 0,5753 
0,20| 0,5793| 0,5832] 0,5871/ 0,5910 | 0,5948) 0,5987) 0,6026] 0,6064| 0,6103 0,6141 
0,30| 0,6179| 0,6217  0,6255| 0,6293 | 0,6331) 0,6368) 0,6406 0,6443 | 0,6480] 0,6517 
0,40| 0,6554| 0,6591) 0,6628/ 0,6664| 0,6700| 0,6736] 0,6772| 0,6808| 0,6844] 0,6879 
0,50| 0,6915| 0,6950) 0,6985 0,7019 | 0,7054| 0,7088] 0,7123 0,7157| 0,7190] 0,7224 
0,60| 0,7257| 0,7291) 0,7324) 0,7357| 0,7389) 0,7422] 0,7454) 0,7486| 0,7517| 0,7549 
0,70| 0,7580| 0,7611) 0,7642| 0,7673| 0,7704| 0,7734] 0,7764) 0,7794| 0,7823] 0,7852 
0,80| 0,7881) 0,7910] 0,7939) 0,7967| 0,7995) 0,8023) 0,8051) 0,8079 | 0,8106] 0,8133 
0,90| 0,8159| 0,8186) 0,8212/ 0,8238| 0,8264) 0,8289] 0,8315) 0,8340] 0,8365] 0,8389 
1,00| 0,8413] 0,8438) 0,8461] 0,8485| 0,8508] 0,8531) 0,8554] 0,8577) 0,8599| 0,8621 
1,10 0,8643] 0,8665) 0,8686] 0,8708| 0,8729] 0,8749 0,8770) 0,8790) 0,8810| 0,8830 
1,20/ 0,8849] 0,8869) 0,8888) 0,8907) 0,8925  0,8944| 0,8962 0,8980) 0,8997] 0,9015 
1,30 0,9032] 0,9049) 0,9066] 0,9082) 0,9099] 0,9115)! 0,9131) 0,9147) 0,9162| 0,9177 
1,40| 0,9192] 0,9207| 0,9222| 0,9236| 0,9251] 0,9265| 0,9279] 0,9292) 0,9306| 0,9319 
1,50 0,9332] 0,9345| 0,9357| 0,9370| 0,9382  0,9394| 0,9406| 0,9418) 0,9429| 0,9441 
1,60 0,9452] 0,9463| 0,9474| 0,9484 | 0,9495 0,9505 0,9515) 0,9525) 0,9535| 0,9545 
1,70 0,9554| 0,9564| 0,9573| 0,9582 | 0,9591] 0,9599| 0,9608) 0,9616) 0,9625| 0,9633 
1,80 0,9641] 0,9649| 0,9656| 0,9664 | 0,9671) 0,9678 0,9686) 0,9693] 0,9699| 0,9706 
1,90/ 0,9713| 0,9719| 0,9726| 0,9732| 0,9738  0,9744| 0,9750| 0,9756| 0,9761) 0,9767 
2,00 0,9773| 0,9778) 0,9783) 0,9788) 0,9793| 0,9798| 0,9803 0,9808 | 0,9812] 0,9817 
2,10 | 0,9821) 0,9826 0,9830/ 0,9834| 0,9838| 0,9842| 0,9846 0,9850 | 0,9854| 0,9857 
2,20 | 0,9861) 0,9864 0,9868, 0,9871| 0,9875| 0,9878| 0,9881| 0,9884| 0,9887] 0,9890 
2,30 | 0,9893| 0,9896 0,9898)  0,9901| 0,9904| 0,9906| 0,9909 0,9911] 0,9913] 0,9916 
2,40 | 0,9918) 0,9920) 0,9922| 0,9925) 0,9927| 0,9929| 0,9931| 0,9932| 0,9934| 0,9936 
2,50 | 0,9938| 0,9940] 0,9941) 0,9943| 0,9945| 0,9946| 0,9948] 0,9949 | 0,9951| 0,9952 
2,60) 0,9953| 0,9955 0,9956)  0,9957| 0,9959| 0,9960| 0,9961) 0,9962| 0,9963| 0,9964 
2,70 | 0,9965) 0,9966 0,9967 0,9968 | 0,9969| 0,9970| 0,9971) 0,9972| 0,9973| 0,9974 
2,80 0,9974| 0,9975) 0,9976) 0,9977) 0,9977| 0,9978| 0,9979| 0,9979| 0,9980 | 0,9981 
2,90 | 0,9981) 0,9982 0,9983) 0,9983| 0,9984| 0,9984| 0,9985 0,9985] 0,9986| 0,9986 
3,00 0,9987| 0,9987) 0,9987/ 0,9988| 0,9988| 0,9989| 0,9989) 0,9989| 0,9990] 0,9990 
3,10 0,9990| 0,9991) 0,9991 | 0,9991| 0,9992| 0,9992) 0,9992 | 0,9992| 0,9993| 0,9993 
3,20 0,9993] 0,9993| 0,9994) 0,9994| 0,9994 0,9994| 0,9994) 0,9995 | 0,9995| 0,9995 
3,30, 0,9995] 0,9995| 0,9996| 0,9996| 0,9996  0,9996| 0,9996] 0,9996] 0,9996| 0,9997 
3,40 | 0,9997| 0,9997| 0,9997 | 0,9997 | 0,9997!  0,9997| 0,9997 | 0,9997| 0,9997| 0,9998 
3,50, 0,9998) 0,9998| 0,9998] 0,9998| 0,9998  0,9998| 0,9998) 0,9998] 0,9998| 0,9998 
3,60 0,9998) 0,9998| 0,9999] 0,9999| 0,9999 0,9999| 0,9999] 0,9999] 0,9999| 0,9999 
3,70, 0,9999| 0,9999 0,9999 0,9999 | 0,9999| 0,9999| 0,9999 0,9999| 0,9999| 0,9999 
3,80 0,9999) 0,9999 0,9999 0,9999 | 0,9999| 0,9999| 0,9999 0,9999| 0,9999] 1,0000 
3,901 1,0000| 1,0000 1,0000/ 1,0000 | 1,0000| 1,0000] 1,0000 1,0000 | 1,0000| 1,0000 
4,00, 1,0000| 1,0000] 1,0000| 1,0000| 1,0000| 1,0000| 1,0000| 1,0000| 1,0000) 1,0000 


Profesor: Fausto Matos Uribe de la Universidad Nacional Mayor de San Marcos 


183 


PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION NORMAL ESTANDAR 


(PARA VALORES NEGATIVOS DE 2) 


-0,0900 | -0,0800 | -0,0700 | -0,0600 | -0,0500 | -0,0400 | -0,0300 | -0,0200 -0,0100| 0,0000 Z 
0,0000 | 0,0000 | 0,0000! 0,0000 0,0000 0,0000 | 0,0000/ 0,0000 0,0000 0,0000 -4,0 
0,0000 | 0,0000 | 0,0000! 0,0000 0,0000 | 0,0000 | 0,0000 0,0000 0,0000 0,0000 -3,9 
0,0001 | 0,0001 | 0,0001 0,0001 0,0001 0,0001 | 0,0001! 0,0001 0,0001 0,0001 -3,8 
0,0001 | 0,0001 | 0,0001! 0,0001 0,0001 0,0001 | 0,0001! 0,0001 0,0001 0,0001 -3,7 
0,0001 | 0,0001 | 0,0001 0,0001 0,0001 0,0001 | 0,0001 0,0001 0,0002 0,0002 -3,6 
0,0002| 0,0002| 0,0002 0,0002 0,0002| 0,0002| 0,0002 0,0002 0,0002 0,0002 -3,5 
0,0002 | 0,0003 | 0,0003 0,0003 0,0003 0,0003 | 0,0003 0,0003 0,0003 0,0003 -3,4 
0,0003 | 0,0004| 0,0004 0,0004 0,0004 0,0004 | 0,0004 0,0005 0,0005 0,0005 -3,3 
0,0005| 0,0005| 0,0005 0,0006 0,0006 0,0006 | 0,0006 0,0006 0,0007 0,0007 -3,2 
0,0007 0,0007 | 0,0008 0,0008 0,0008 0,0008| 0,0009 0,0009 0,0009 0,0010 -3,1 
0,0010 | 0,0010 | 0,0011! 0,0011 0,0011| 0,0012| 0,0012 0,0013 0,0013 0,0014 -3,0 
0,0014 | 0,0014| 0,0015! 0,0015 0,0016 0,0016| 0,0017 0,0018 0,0018 0,0019 -2,9 
0,0019 | 0,0020 | 0,0021 0,0021 0,0022| 0,0023 | 0,0023 0,0024 0,0025 0,0026 -2,8 
0,0026 | 0,0027 | 0,0028 0,0029 0,0030| 0,0031| 0,0032 0,0033 0,0034 0,0035 -2,7 
0,0036 | 0,0037 | 0,0038 0,0039 0,0040 0,0041 | 0,0043 0,0044 0,0045 0,0047 -2,6 
0,0048 | 0,0049 | 0,0051 0,0052 0,0054 0,0055 | 0,0057 0,0059 0,0060 0,0062 -2,5 
0,0064 | 0,0066 | 0,0068 0,0069 0,0071| 0,0073 | 0,0075 0,0078 0,0080 0,0082 -2,4 
0,0084 | 0,0087 | 0,0089 0,0091 0,0094 0,0096 | 0,0099 0,0102 0,0104 0,0107 -2,3 
0,0110 | 0,0113 | 0,0116! 0,0119 0,0122| 0,0125| 0,0129 0,0132 0,0136 0,0139 -2,2 
0,0143| 0,0146 | 0,0150! 0,0154 0,0158 0,0162| 0,0166 0,0170 0,0174 0,0179 -2,1 
0,0183| 0,0188 | 0,0192 0,0197 0,0202 0,0207 | 0,0212 0,0217 0,0222 0,0228 -2,0 
0,0233| 0,0239 | 0,0244 0,0250 0,0256 0,0262 | 0,0268 0,0274 0,0281 0,0287 -1,9 
0,0294 | 0,0301 | 0,0307 0,0314 0,0322| 0,0329 | 0,0336 0,0344 0,0351! 0,0359 -1,8 
0,0367 | 0,0375| 0,0384 0,0392 0,0401 | 0,0409| 0,0418! 0,0427 0,0436 0,0446 -1,7 
0,0455 | 0,0465 | 0,0475! 0,0485 0,0495| 0,0505| 0,0516 0,0526 0,0537 0,0548 -1,6 
0,0559 | 0,0571| 0,0582 0,0594 0,0606 | 0,0618| 0,0630 0,0643 0,0655 0,0668 -1,5 
0,0681 | 0,0694 | 0,0708 0,0721 0,0735| 0,0749| 0,0764! 0,0778 0,0793 0,0808 -1,4 
0,0823 | 0,0838 | 0,0853 0,0869 0,0885| 0,0901 | 0,0918 0,0934 0,0951 0,0968 -1,3 
0,0985| 0,1003 | 0,1020 0,1038 0,1057 0,1075 | 0,1093 0,1112 0,1131 0,1151 -1,2 
0,1170 | 0,1190 | 0,1210! 0,1230 0,1251 0,1271| 0,1292 0,1314 0,1335 0,1357 -1,1 
0,1379 | 0,1401 | 0,1423 0,1446 0,1469 0,1492 | 0,1515! 0,1539 0,1562 0,1587 -1,0 
0,1611 0,1635 | 0,1660 0,1685 0,1711| 0,1736| 0,1762 0,1788 0,1814 0,1841 -0,9 
0,1867 | 0,1894 | 0,1922 0,1949 0,1977| 0,2005 | 0,2033 0,2061 0,2090 0,2119 -0,8 
0,2148 | 0,2177 | 0,2207 0,2236 0,2266 | 0,2297 | 0,2327 0,2358 0,2389 0,2420 -0,7 
0,2451 | 0,2483 | 0,2514 0,2546 0,2578 0,2611 | 0,2643 0,2676 0,2709 0,2743 -0,6 
0,2776| 0,2810 | 0,2843 0,2877 0,2912| 0,2946| 0,2981 0,3015 0,3050 0,3085 -0,5 
0,3121 | 0,3156| 0,3192 0,3228 0,3264 0,3300 | 0,3336 0,3372 0,3409 0,3446 -0,4 
0,3483 0,3520 | 0,3557 0,3594 0,3632| 0,3669 | 0,3707 0,3745 0,3783 0,3821 -0,3 
0,3859 0,3897 | 0,3936 0,3974 0,4013| 0,4052| 0,4090! 0,4129 0,4168 0,4207 -0,2 
0,4247 | 0,4286 | 0,4325 0,4364 0,4404 0,4443 | 0,4483 0,4522 0,4562 0,4602 -0,1 
0,4641 0,4681 | 0,4721! 0,4761 0,4801 | 0,4840 | 0,4880! 0,4920 0,4960! 0,5000 0,0 

Profesor: Fausto Francisco Matos Uribe 


Universidad Nacional Mayor de San Marcos. 
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